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Beschreibung 

[0001 ] Die vorliegende Erf indung betrifft Gene der Purinbiosynthese aus Ashbya gossypii und deren Verwendung in 
der Riboflavinsynthese. 

5 [0002] Vitamin B2, auch Riboflavin genanrrt. ist fur Mensch und Tier essentiell. Bei Vitamin B2-Mangel treten Entzun- 
dungen der Mund- und Rachenschleimhaute, Juckreiz und Errtzundungen in den Hautfalten und ahnliche Hautscha- 
den, Bindehauterrtzundungen, verminderte Sehscharfe und Trubung der Hornhaut auf. Bei Sauglingen und Kindem 
kOnnen Wachstumsstillstand und Gewichtsabnahme eirrtreten. Vitamin B2 hat daher wirtschaftJiche Bedeutung ins- 
besondere als Vitaminzusatz bei Vitaminmangel und als Futtermittelzusatz. Daneben wird es als Lebensmitterfarbstoff. 

10 beispielsweise in Mayonnaise, Eiscreme. Pudding etc. eingesetzt. 

[0003] Die Herstellung von Vitamin B2 erfolgt entweder chemisch Oder mikrobiell (siehe z.B. Kurth et al. (1 996) Rib- 
oflavin, in: Ullmann's Encyclopedia of industrial chemistry, VCH Weinheim). Bei den chemischen Herstellverfahren wird 
Riboflavin in der Regel in mehrstufigen Prozessen als reines Endprodukt gewonnen, wobei relativ kostspielige Aus- 
gangsprodukte, wie z.B. D-Ribose, eingesetzt werden mussen. Eine Alternative zur chemischen Synthese von Ribofla- 

is vin ist die Herstelltung dieses Stoffes durch Mikroorganismen. Als Ausgangsstoffe dienen dabei nachwachsende 
Rohstoffe, wie Zucker oder pflanzliche Ole. Die Herstellung von Riboflavin durch Fermentation von Pilzen wie Eremo- 
thecium ashbyii oder Ashbya gossypii ist bekannt (The Merck Index, Windholz et al., eds. Merck & Co., Seite 1183, 
1983), aber auch Hefen, wie z.B. Candida, Pichia und Saccharomyces oder Bakterien, wie z.B. Bacillus, Clostridien 
oder Corynebakterien sind als Riboflavin-Produzenten beschrieben. 

20 [0004] In der EP 405370 sind Riboflavin-uberproduzierende Bakerienstamme beschrieben, die durch Transformation 
der Riboflavin-Biosynthese-Gene aus Bacillus subtilis erhalten wurden. Diese dort beschriebenen Gene und andere, 
an der Vitamin B2-Biosynthese beteiligten Gene aus Prokaryonten sind fur ein rekombinantes Riboflavin-Herstellver- 
fahren mit Eukaryonten, wie z.B. Saccharomyces cerevisiae oder Ashbya gossypii ungeeignet. 
[0005] In der DE 44 20 785 sind sechs Ribof lavin-Biosynthesegene aus Ashbya gossypii beschrieben, sowie Mikro- 

25 organismen, die mit diesen Genen transformiert wurden und die Verwendung solcher Mikroorganismen zur Riboflavin- 
synthese. 

[0006] Mit diesen Verfahren ist es moglich. Produktionsstamme fur die mikrobielle Riboflavinsynthese zu erzeugen. 
Diese Produktionsstamme besitzen jedoch haufig Stoffwechsellimitierungen. die durch die insertierten Biosynthese- 
gene nicht beseitigt werden kennen oder manchmal erst dadurch entstehen. Solche Produktionsstammen kOnnen 
30 manchmal nicht genugend Substrat zur Sattigung mancher Biosyntheseschritte liefern, so daB die Biosynthesekapazi- 
tat mancher Stoffwechselabschnitte gar nicht voll ausgeschOpft werden kann. 

[0007] Daher ist es wunschenswert. weitere Teilbereiche von Stoffwechselwegen zu verstarken, dadurch Stoffwech- 
selengpasse zu beseitigen und dadurch dann die fur die mikrobielle Riboflavinsynthese eingesetzten Mikroorganismen 
(Produktionsstamme) bezuglich ihrer FShigkeit zur Riboflavinsynthese weiter zu optimieren. Es ist anzustreben, die zu 
35 verstarkenden Teilbereiche des komplexen Stoffwechsels zu identifizieren und diese auf geeignete Weise zu verstar- 
ken. 

[0008] Die Erfindung betrifft neue Proteins der Purinbiosynthese, deren Gene und deren Verwendung fur die mikro- 
bielle Riboflavinsynthese. 

[0009] Der Purinstoffwechsel (fur eine Ubersicht siehe z.B. Voet, D. und Voet, J.G., 1994, Biochemie, VCH Weinheim, 
40 Seite 743-771 ; Zalkin, H. und Dixon, J.E., 1992, De novo purine nucleotide biosynthesis, in: Progress in nucleic acid 
research and molecular biology. Vol. 42, Seite 259-287, Academic Press) ist ein fur alle Lebewesen essentieller Teil des 
Stoffwechsels. Fehlerhafter Purinstoffwechsel kann beim Menschen zu schweren Krankheiten fuhren (z.B. Gicht). Der 
Purinstoffwechsel ist zudem ein wichtiges target fur die Therapie von Tumorerkrankungen und Virusinfektionen. Zahl- 
lose Publikationen sind erschienen, die Substanzen fur diese Indikationen beschreiben die im Purinstoffwechsel ein- 
45 greifen (als Ubersicht z.B. Christopherson. R.I. und Lyons, S.D., 1990, Potent inhibitors of de novo pyrimidine and 
purine biosynthesis as chemotherapeutic agents, Med. Res. Reviews 10, Seite 505-548). 

[0010] Untersuchungen der in Purinstoffwechsel beteiligten Enzyme (Smith, J.L., Enzymes in nucleotide synthesis, 
1995, Curr. Opinion Struct. Biol. 5, 752-757) zielen darauf ab. neue immunsuppressiv, anti-parasrtar oder anti-prolife- 
rierend wirkende Medikamente zu entwickeln (Biochem. Soc. Transact. 23, Seite 877-902, 1995). 
so [0011] Bei diesen Medikamenten handelt es sich dann ublicherweise urn natCirlich nicht vorkommende Purine, Pyri- 
midine oder davon abgeleiteter Verbindungen. 

[0012] Gegenstand der Erfindung ist ein Protein mit der in SEQ ID NO:2 dargestellten Polypeptidseqenz oder einer 
aus SEQ ID NO:2 durch Substitution, Insertion oder Deletion von bis zu 15% der Aminosauren erhaltlichen Polypeptid- 
sequenz und der enzymatischen Aktivitat einer Phosphoribosylpyrophosphat-Synthetase. 
55 [0013] Die in SEQ ID NO:2 dargestellte Sequenz ist das aus Ashbya gossypii erhaltene Genprodukt des KPR1 Gens 
(SEQIDNO:1). 

[0014] Ein weiterer Gegenstand der Erfindung ist ein Protein mit der in SEQ ID NO:5 dargestellten Polypeptidseqenz 
oder einer aus SEQ ID NO:5 durch Substitution, Insertion oder Deletion von bis zu 10% der Aminosauren erhaltlichen 
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Polypeptidsequenz und der enzymatischen Aktivitat einer Glutamin-Phosphoribosylpyrophosphat-Amidotransferase. 
[001 5] Die in SEQ ID NO:5 dargestellte Sequenz ist das aus Ashbya gossypii erhaltene Genprodukt des ADE4 Gens 
(SEQ ID NO:3). 

[0016] Ein weiterer Gegenstand der Erfindung ist ein Protein mit der in SEQ ID NO:8 dargestellten Polypeptidseqenz 
s oder einer aus SEQ ID NO:8 durch Substitution, Insertion Oder Deletion von bis zu 20% der Aminosauren erhaltlichen 
Polypeptidsequenz und der enzymatischen Aktivitat einer IMP-Dehydrogenase. 

[001 7] Die in SEQ ID NO:8 und 9 dargestellte Sequenz ist das aus Ashbya gossypii erhaltene Genprodukt des GUA1 
Gens (SEQ ID NO:7). 

[0018] Ein weiterer Gegenstand der Erfindung ist ein Protein mit der in SEQ ID NO:1 1 dargestellten Polypeptidseqenz 
10 oder einer aus SEQ ID NO: 1 1 durch Substitution, Insertion oder Deletion von bis zu 1 0% der Aminosauren erhaltlichen 
Polypeptidsequenz und der enzymatischen Aktivitat einer GMP-Synthetase. 

[0019] Die in SEQ ID NO:1 1 dargestellte Sequenz ist das aus Ashbya gossypii erhaltene Genprodukt des GUA2 Gens 
(SEQ ID NO.10). 

[0020] Ein weiterer Gegenstand der Erfindung ist ein Protein mit der in SEQ ID NO: 13 dargestellten Polypeptidseqenz 
75 oder einer aus SEQ ID NO:13 durch Substitution, Insertion oder Deletion von biszu 10% der Aminosauren erhaltlichen 
Polypeptidsequenz und der enzymatischen Aktivitat einer Phosphoribosylpyrophosphat-Synthetase. 
[0021] Die in SEQ ID NO: 13 dargestellte Sequenz ist das aus Ashbya gossypii erhaltene Genprodukt des KPR2 Gens 
(SEQ ID NO:12). 

[0022] Diese genannten Genprodukte konnen durch ubliche Verfahren der Gentechnologie wie ortsgerichtete Muta- 
20 genese so verandert werden, daB bestimmte Aminosauren ausgetauscht, zusatzlich eingefuhrt oder entfernt werden. 
Oblicherweise (aber nicht ausschliefBlich) werden Aminosaurereste durch solche ahnlicher Raumerfiillung, Ladung 
oder Hydrophilie/Hydrophobie ausgetauscht urn die enzymatischen Eigenschaften der Genprodukte nicht zu verlieren. 
Insbesondere im aktjven Zentrum fuhren Veranderungen der Aminosauresequenz oft zu drastischer Veranderung der 
enzymatischen Aktivitaten. An anderen, weniger essentiellen Stellen werden jedoch Veranderungen der Aminosaure- 
25 sequenz haufig toleriert. 

[0023] Bei den erf indungsgemafJen Proteinen konnen 

1. im Fall des Genproduktes des AgKPR1-Gens, bis zu 15, bevorzugt bis zu 10 und besonders bevorzugt bis zu 
5% der Aminosauren gegenuber der im Sequenzprotokoll dargestellten Sequenzen verandert sein; 

30 

2. im Fall des Genproduktes des AgADE4-Gens, bis zu 10 und besonders bevorzugt bis zu 5% der Aminosauren 
gegenuber der im Sequenzprotokoll dargestellten Sequenzen verandert sein; 

3. im Fall des Genproduktes des AgGUAl -Gens, bis zu 20, bevorzugt bis zu 1 5, besonders bevorzugt bis zu 1 0 und 
35 insbesondere bevorzugt bis zu 5% der Aminosauren gegenuber der im Sequenzprotokoll dargestellten Sequenzen 

verandert sein; 

4. im Fall des Genproduktes des AgGUA2-Gens, bis zu 10 und besonders bevorzugt bis zu 5% der Aminosauren 
gegenuber der im Sequenzprotokoll dargestellten Sequenzen verandert sein; 

40 

5. im Fall des Genproduktes des AgKPR2 Gens bis zu 10 %, bevorzugt bis zu 7 % und besonders bevorzugt bis 
zu 5 % der Aminosauren gegenuber der im Sequenzprotokoll dargestellten Sequenzen verandert sein. 

[0024] Bevorzugt sind solche Proteine, die zwar noch die jeweilige enzymatische Aktivitat besitzen, aber in ihrer 
45 Regulation verandert worden sind. Viele dieser Enzyme unterliegen einer starken Aktivitatskontrolle durch Zwischen- 
und Endprodukte (feedback-Inhibition). Dies fuhrt dazu, daB die Enzyme, sobald geniigend Endprodukt vorhanden ist, 
in ihrer Aktivitat gedrosselt werden. 

[0025] Diese im physiologischen Zustand okonomische Regelung fuhrt bei Produktionsstammen jedoch haufig dazu, 
daB die Produktivitat nicht uber eine gewisse Grenze hinaus gesteigert werden kann. Durch Beseitigung einer solchen 
so feedback-Inhibition erreicht man, daB die Enzyme ungeachtet der Endproduktkonzentration ihre Aktivitat beibehalten 
und dadurch Stoffwechselengpasse umgangen werden. Dies fuhrt letztlich zu einer deutlichen Steigerung der Ribofla- 
vinbiosynthese. 

[0026] Bevorzugte erfindungsgemaBe Proteine sind solche, die nicht mehr durch Folgeprodukte von Stoffwechselwe- 
gen (die von Produkten der Enzyme ausgehen) gehemmt werden. Besonders bevorzugte erfindungsgemaBe Proteine 
55 sind solche. die nicht mehr durch Zwischenprodukte der Purinbiosynthese, insbesonder durch Purinbasen, Purinnu- 
kleoside. PurinnuWeotid-5'-Monophosphate oder PurinnuWeotid-5'-Diphosphate oder PurinnuWeotid-5'-Triphosphate 
gehemmt werden. Insbesondere bevorzugte erfindungsgemaBe Proteine sind solche, mit nachfolgenden Veranderun- 
gen der Aminosauresequenz und alle Kombinationen von Aminosauresequenz-Veranderungen, die diese nachfolgen- 
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den Veranderungen enthalten. 

[0027] Veranderungen der Aminosauresequenz am AgKPRI Genprodukt: 

Lysin an Position 7 ausgetauscht gegen Valin Aspartat an Position 52 ausgetauscht gegen Histidin Leucin an Posi- 
5 tion 131 ausgetauscht gegen Isoleucin Aspartat an Position 186 ausgetauscht gegen Histidin Alanin an Position 

193 ausgetauscht gegen Valin Histidin an Position 196 ausgetauscht gegen Glutamin 

[0028] Veranderungen der Aminosauresequenz am AgADE4 Genprodukt: 

w Aspartat an Position 310 ausgetauscht gegen Valin Lysin an Position 333 ausgetauscht gegen Alanin Alanin an 
Position 41 7 ausgetauscht gegen Tryptophan 

[0029] Die folgenden Beispiele beschreiben die Herstellung der erfindungsgemaBen Proteine und NuWeinsauren 
sowie deren Verwendung zur Herstellung von Mikroorganismen mit gesteigerter Riboflavinsynthese. 

15 

Beispiel 1 : 

Herstellung einer genomischen Genbank aus Ashbya gossypii ATCC10895 

20 [0030] Genomische DNA aus Ashbya gossypii ATCC10895 kann nach Qblichen Verfahren prapariert werden, z.B. wie 
beschrieben in EP9703208. Die genomische Genbank ausgehend von dieser DNA, kann nach Qblichen Methoden 
(z.B. Sambrook, J. et al. (1 989) Molecular cloning: a laboratory manual, Cold Spring Harbor Laboratory Press oder Aus- 
ubel, F.M. et al. (1994) Current protocols in molecular biology, John Wiley and sons) in beliebigen Plasmiden oder Cos- 
miden, wie z.B. SuperCosI (Stratagene. La Jolla, USA) erstellt werden. 

25 

Beispiel 2: 

Klonierung des Gens fur PRPP-Synthetase aus Ashbya gossypii ATCC10895 (AgKPRI) 

30 [0031] Die Klonierung des Gens fur PRPP-Synthetase aus Ashbya gossypii (AgKPRI) kann uber zwei Schritte ver- 
laufen. Im ersten Schritt kann mit folgenden Oligonukleotiden einen definierten Bereich des KPR1 Gens aus genomi- 
scher DNA von Ashbya gossypii uber PCR amplHizieren: 

KPR5: 5'- GATGCTAGAGACCGCGGGGTGCAAC -3' 
KPR3: 5'- TGTCCGCCATGTCGTCTACAATAATA -3" 

35 [0032] Die PCR kann nach Qblicher Methode durchgefuhrt werden. Das resuftierende 330 bp DNA Fragment kann 
mit ublichen Methoden in den Vektor pGEMT (Promega, Madison, USA) Woniert und sequenziert werden. 
[0033] Mit dieser NukJeotidsequenz a!s Sonde kann mit ublichen Methoden eine genomische Cosmid-Genbank ges- 
creent werden. Von einem Cosmid, das ein Signal mit dieser Sonde ergibt, kann dann ein 191 1 bp Pstl-Hindlll Frag- 
ment in den Vektor pBluescript SK+ (Stratagene, La Jolla, USA) subWoniert werden. Auf diesem Fragment liegen das 

40 KPR1 Gen und unvollstandige ORFs, die Homologie zeigen zu den UBC6 und UBP9 Genen aus Saccharomyces cere- 
visiae. 

[0034] Die PRPP-Synthetase KPR2 und die putative PRPP-Synthetase KPR4 aus Saccharomyces cerevisiae sind 
die Enzyme, die der PRPP-Synthetase aus Ashbya gossypii mit Ahnlichkeiten von 80,2% bzw. 79,6% am verwandte- 
sten sind. Die KPR2 und KPR4 Gene aus Saccharomyces cerevisiae sind zu 67.6% bzw. 67.8% Shnlich zum KPR1 
45 Gen aus Ashbya gossypii. Andere Enzyme bzw. Gene aus anderen Organismen sind deutlich verschiedener zum 
KPR1 Gen bzw. zur PRPP-Synthetase aus Ashbya gossypii. 

[0035] Die Sequenzvergleiche konnen z.B. mit dem Clustal Algorithmus mit Hilfe der PAM250 Gewichtungstabelle 
oder dem Wilbur-Lipman DNA alignment Algorithmus (wie z.B. in dem Programrrtpaket MegAlign 3.06 der Firma DNA- 
star implementiert) durchgefuhrt werden. Mit dem beschriebenen Oligonukleotide-Paar ist es nicht moglich, die Gene 

so fur die verschiedenen PRPP-Synthetasen aus Saccharomyces cerevisiae zu amplifizieren. 

[0036] Mit der Sonde kann man auch noch einen Klon aus der Genbank finden. Dieser zwerte Klon zeigte ein Gen, 
das ebenfalls fur eine PRPP Synthetase kodiert Dieses Gen wird AgKPR2 genannt und ist deutlich verschieden zu 
AgKPRI. AgKPR2 zeigt auf Aminosaureebene 66 % Identitat zu AgKPRI. Das AgKPR2 Gen (SEQ ID NO: 12) wurde 
mit alien Proteinen der Swissprot Datenbank verglichen. Die maximale Ahnlichkeit zeigt dieses Protein (88 % Identitat 

55 bzw. 95 % Aknlichkeit) zum KPR3 Genprodukt aus Saccharomyces cerevisiae. Das Genprodukt des AgKPRI Gens ist 
fur den uberwiegenden Teil der Aktivitat der PRPP Synthetase bei Ashbya gossypii verantwortJich. Wenn man das 
AgKPRI Gen von Ashbya gossypii disruptiert (analog zur Disruption anderer Ashbya Gene, wie in den Beschreibungen 
in den Beispielen 6-8), dann f indet man deutlich verringerte Enzymaktivitat: start 22 U/mg Protein nur noch 3 U/mg Pro- 
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tein. Zur Analytik siehe Beispiel 13. In Beispiel 11, 13 und 15 werden Ausfuhrungsbeispiele mit dem AgKPRI Gen 
gezeigt, man kann solche Arbeiten aber auch mit AgKPR2 durchfuhren. 

Beispiel 3: 

5 

Klonierung des Gens fur Glutamin-PRPP-Amidotransferase aus Ashbya gossypii ATCC10895 (AgADE4) 

[0037] Die Klonierung des Gens fur Glutamin-PRPP-Amidotransferase aus Ashbya gossypii (AgADE4) kann uber 
zwei Schritte verlaufen. Im ersten Schritt kann mit folgenden Oligonukleotiden einen definierten Bereich des AgADE4 

10 Gens aus genomischer DNA von Ashbya gossypii uber PCR amplifizieren: 
ADE4A: 5'- ATATCTTGATGAAGACGTTCACCGT -3' 
ADE4B: 5'- GATAATGACGGCTTGGCCGGGAAGA -3' 
[0038] Die PCR kann nach ublicher Methode durchgefiihrt werden. Das resultierende 360 bp DNA Fragment kann 
mit ublichen Methoden in den Vektor pGEMT (Promega, Madison, USA) kloniert und dann sequenziert werden. 

15 [0039] Mit dieser Sequenz als Sonde kann mit ublichen Methoden eine genomische Cosmid-Genbank gescreent wer- 
den. Von einem Cosmid, das ein Signal mit dieser Sonde ergibt, kann dann ein 5369 bp Hindi II Fragment in den Vektor 
pBluescript SK+ (Stratagene, La Jolla, USA) subkloniert werden. Auf diesem Fragment liegen das AgADE4 Gen und 
das Gen fur das Ashbya Homolog fur den mitochondrialen ABC Transporter ATM1 aus Saccharomyces cerevisiae und 
ein weiterer offener Leseraster, dessen Funktion nicht bekannt ist. 

20 [0040] Das AgADE4 Genprodukt (Glutamin-PRPP-Amidotransferase) zeigt die deutlichste Ahnlichkeit zu den ADE4 
Genprodukten aus Saccharomyces cerevisiae und Saccharomyces kluyveri (81% bzw. 86.3%). Die entsprechenden 
Gene sind jedoch nur zu 68.8% bzw. 72% homolog. Die Ahnlichkeit zu anderen Glutamin-PRPP-Amidotransferasen ist 
deutlich geringer (z.B. nur 27.5% Ahnlichkeit zum entsprechenden Enzym aus Bacillus subtilis). Die Sequenzvergleiche 
kann man so durchfuhren, wie in Beispiel 2 beschrieben. 

25 [0041] Es ist mit dem beschriebenen Paar an Oligonukleotiden nicht moglich, die ADE4 Gene aus Saccharomyces 
cerevisiae oder Saccharomyces kluyveri zu amplifizieren. 

Beispiel 4: 

30 Klonierung des Gens fur Inosin-Monophosphat-Dehydrogenase aus Ashbya gossypii ATCC1 0895 (AgGUAl) 

[0042] Die Klonierung des Gens fur Inosin-Monophosphat-Dehydrogenase aus Ashbya gossypii (AgGUAl) kann uber 
zwei Schritte verlaufen. 

[0043] Im ersten Schritt kann man mit folgenden Oligonukleotiden einen definierten Bereich des AgGUAl Gens aus 

35 genomischer DNA von Ashbya gossypii uber PCR amplifizieren. 
IMP5: 5'- GGCATCAACCTCGAGGAGGCGAACC -3' 
IMP3: 5'- CAGACCGGCCTCGACCAGCATCGCC - 3' 
[0044] Die PCR kann nach ublicher Methode durchgefiihrt werden. Das resultierende 230 bp DNA Fragment kann 
mit ublichen Methoden in den Vektor pGEMT (Promega, Madison, USA) kloniert und dann sequenziert werden. 

40 [0045] Mit dieser Sequenz als Sonde kann mit ublichen Methoden eine genomische Cosmid-Genbank gescreent wer- 
den. Von einem Cosmid, das ein Signal mit dieser Sonde ergibt, kann ein 3616 bp Apal Fragment in den Vektor pBlue- 
script SK+ (Stratagene, La Jolla, USA) subkloniert werden. Die kodierende Region des AgGUAl Gens Gens ist 1569 
bp lang und ist unterbrochen von einem161 bp langen Intron. Die Intron Grenzen (5' splice site AGGTATGT und 3' 
splice site CAG) kann man durch Klonierung und Sequenzierung von AgGUAl cDNA verifizieren. 

45 [0046] AgGUAl ist das erste beschriebene Gen aus Ashbya gossypii mit einem Intron. 

[0047] Das AgGUAl Genprodukt (IMP-Dehydrogenase) zeigt die deutlichste Ahnlichkeit zu den 4 IMP-Dehydrogena- 
sen aus Saccharomyces cerevisiae (Ahnlichkeiten zwischen 67% und 77.2%). Die Ahnlichkeit zu anderen IMP-Dehy- 
drogenasen ist deutlich geringer Die Sequenzvergleiche kann man so durchfuhren, wie in Beispiel 2 beschrieben. 
Ashbya gossypii scheint nur ein Gen fur dieses Enzym zu haben. Dies kann man durch southern blotting mit genomi- 

50 scher DNA von Ashbya gossypii mit Hilfe der oben genannter Sonde zeigen. 

[0048] Das Gen aus Saccharomyces cerevisiae, das fur die dem AgGUAl Genprodukt ahnlichste IMP-Dehydroge- 
nase kodiert (IMH3), hat eine Ahnlichkeit von 70.2% zum AgGUAl Gen. Es ist mit dem beschriebenen Paar an Oligo- 
nukleotiden nicht moglich, dieses Gen aus Saccharomyces cerevisiae zu amplifizieren. 

55 
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Beispiel 5: 

Klonierung des Gens fur Guanosin-Monophosphat-Svrrthetase aus Ashbya gossypii ATCC10895 (AgGUA2) 

5 [0049] Die Klonierung des Gens fur Guanosin-Monophosphat-Syrrthetase aus Ashbya gossypii (AgGUA2) kann Qber 
zwei Schritte verlaufen. Im ersten Schrttt kann man mit folgenden Oligonukteotiden einen definierten Bereich des 
AgGUA2 Gens aus genomischer DNA von Ashbya gossypii Qber PCR amplifizieren: 
GUA2A: 5'- TGGACCGGGCGGTGTTCGAGTTGGG -3' 
GUA2B: 5'- AGGCTGGATCCTGGCTGCCTCGCGC -3' 
10 [0050] Die PCR Reaktion kann nach ublicher Methode durchgefuhrt werden. Das resultierende 750 bp DNA Frag- 
ment kann mit ublichen Methoden in den Vektor pBluescript SK+ (Stratagene, La Jolla. USA) Woniert und dann sequen- 
ziert werden. 

[0051 ] Mit dieser Sequenz als Sonde kann mit ublichen Methoden eine genomische Cosmid-Genbank gescreent wer- 
den. Von einem Cosmid, das ein Signal mit dieser Sonde ergibt, kann dann ein 2697 bp Clal-EcoRV Fragment in den 

15 Vektor pBluescript SK+ (Stratagene, La Jolla, USA) subkfoniert werden. 

[0052] Das AgGUA2 Genprodukt (GMP-Synthetase) zeigt die deutlichste Ahnlichkeit zu GMP-Synthetase aus Sac- 
charomyces cerevisiae (Ahnlichkeiten 86.6%). Die Gene fur die GMP-Synthetasen aus Saccharomyces cerevisiae und 
Ashbya gossypii sind zu 71.2% homolog. Die Ahnlichkeit des AgGUA2 Genproduktes zu anderen IMP-Dehydrogena- 
sen ist deutlich geringer Die Sequenzvergleiche kann man so durchfuhren, wie in Beispiel 2 beschrieben. 

20 [0053] Es ist mit dem beschriebenen Paar an Oligonukleotiden nicht moglich. das GMP-Synthetase Gen aus Saccha- 
romyces cerevisiae zu amplifizieren. 

Beispiel 6: 

25 Disruption des AgADE4 Gens von Ashbya gossypii ATCC 1 0895 

[0054] Unter Disruption eines Genes versteht man die Zerstdrung der Funktionalitat einer genomischen Kopie des 
Gens entweder durch (a) Entfernen eines Teiles der Gensequenz. oder durch (b) der Unterbrechung des Gens durch 
Einfugung eines Stuckes Fremd-DNA in das Gen oder durch (c) Ersatz eines Teil des Gens durch Fremd-DNA. Die ver- 
30 wendete Fremd-DNA ist beliebig, bevorzugt aber ein Gen, das Resistenz gegen eine beliebige Chemikalie bewirkt. Zur 
Disruption von Genen konnen beliebige Resistenzgene verwendet werden. 

[0055] Zur Disruption des AgADE4-Gens von Ashbya gossypii ATCC1 0895 kann man ein Gen verwenden, das Resi- 
stenz gegen G418 vermittelt. Es kann sich dabei urn das Kanamycin-Resistenzgen aus TN903, unter Kontrolle des 
TEF-Promotors von Ashbya gossypii (siehe z.B. Yeast 10, S.1793-1808, 1994, WO9200379) handeln. Das Gen ist 5' 

35 und 3' von mehreren Schnittstellen fur RestriktionsendonuWeasen f lankiert, so daB eine Kassette aufgebaut wurde, die 
beliebige Konstruktionen von Gen-Disruptionen mit ublichen Methoden der in vitro Manipulation von DNA ermoglichen. 
[0056] Das interne Hinc!! Fragment von AgADE4 (zwischen den Positionen 2366 und 2924) kann durch eine wie oben 
skizzierte Resistenzkassette ersetzt werden. Das erhaltene Konstrukt erhalt den Namen ade4::G418. 
[0057] Das erhaltene Plasmid kann man in E.coli vermehren. Das BamHI / Bglll- Fragment des Konstruktes 

40 ade4::G41 8 kann prapariert, uber Agarosegel-Elektrophorese und nachfolgende Elution der DNA aus dem Gel (siehe 
Proc. Natl. Acad. Sci. USA 76, 615-619. 1979) aufgereinigt und zur Transformation von Ashbya gossypii eingesetzt 
werden. 

[0058] Ashbya gossypii kann durch Protoplastentransformation (Gene 109, 99-105, 1991), bevorzugt aber durch 
Elektroporation (BioRad Gene Pulser, Bedingungen: Kuvetten mit Spaltbreite 0,4 mm, 1500V, 25nF 100£1) transfor- 
45 miert werden. Die Selektion transformierter Zellen erfolgt auf G418-haltigem Festmedium. 

[0059] Erhaltene G418-resistente Klone konnen mit ublichen Methoden der PCR und Southern-Blot Analyse darauf- 
hin untersucht werden, ob die genomische Kopie des AgADE4 Gens tatsachlich zerstort ist. Klone, deren AgADE4 Gen 
zerstort ist, sind Purin- auxotroph. 

so Beispiel 7: 

Disruption des AgGUAl Gens von Ashbya gossypii ATCC10895 

[0060] Zur prinzipiellen Beschreibung der Disruption von Genen, der Verwendung einer Resistenzkassette und der 
55 Transformation von Ashbya gossypii siehe Beispiel 6. 

[0061] Das interne Xhol / Kpnl Fragment von AgGUAl (zwischen den Positionen 1620 und 2061) kann durch eine 
wie oben skizzierte Resistenzkassette ersetzt werden. Das erhaltene Konstrukt erhalt den Namen gual ::G418. 
[0062] Das erhaltene Plasmid kann in E.coli vermehrt werden. Das Xbal / BamHI - Fragment des Konstruktes 
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gua1::G418 kann prapariert, uber Agarosegel-Elektrophorese und nachfolgende Elution der DNA aus dem Gel aufge- 
reinigt und zur Transformation von Ashbya gossypii eingesetzt werden. 

[0063] Erhaltene G41 8-resistente Klone konnen mit Oblichen Methoden der PCR und Southern-Blot Analyse darauf- 
hin untersucht werden, ob die genomische Kopie des AgGUAl Gens tatsachlich zerstort ist. Klone, deren AgGUAl Gen 
5 zerst6rt ist, sind Guanin- auxotroph. 

Beispiel 8: 

Disruption des AgGUA2 Gens von Ashbya gossypii ATCC10895 

10 

[0064] Zur prinzipiellen Beschreibung der Disruption von Genen, der Verwendung einer Resistenzkassette und der 
Transformation von Ashbya gossypii siehe Beispiel 6. 

[0065] Das interne Sail Fragment von AgGUA2 (zwischen den Positionen 1 153 und 1219) kann man durch eine wie 
oben skizzierte Resistenzkassette ersetzen. Das erhaltene Kbnstrukt erhait den Namen gua2::G418. 
15 [0066] Das erhaltene Plasmid kann in E.coli vermehrt werden. Das Xbal / BamHI - Fragment des Konstruktes 
gua2::G418 kann prapariert, uber Agarosegel-Elektrophorese und nachfolgende Elution der DNA aus dem Gel aufge- 
reinigt und zur Transformation von Ashbya gossypii eingesetzt werden. 

[0067] Erhaltene G41 8-resistente Klone konnen mit Oblichen Methoden der PCR und Southern-Blot Analyse darauf- 
hin untersucht werden, ob die genomische Kopie des AgGUA2 Gens tatsachlich zerstort ist. Klone, deren AgGUA2 Gen 
20 zerstort ist, sind Guanin- auxotroph. 

Beispiel 9: 

Klonierung des GAP-Promotors aus Ashbya gossypii 

25 

[0068] Das Gen fOr Glycerinaldehyd-3-Phosphat-Dehydrogenase aus Ashbya gossypii (AgGAP) kann man durch ein 
allgemein ubliches Screening einer genomischen Ashbya gossypii Cosmid-Genbank (siehe Beispiel 1 , mit einer Sonde, 
die aus Sequenzinformationen des GAP Gens aus Saccharomyces cerevisiae erstelH wurde) Wonieren. 
[0069] Der 5' nicht-translatierte Bereich des Gens (-373 bis -8 Region, bezogen auf den Translationsstart) wurde als 

30 Promotor angenommen. Flankierend zu dieser Sequenz wurden 2 Schnittstellen fur die RestriktionsendonuWease 
Not1 eingefuhrt. In diesem Bereich f indet man die bona fide TATA Box (nt 224-230), zwei Sequenzabschnitte (nt 43-51 
und 77-85), die dem sogenannten GCR1 binding element und einen Sequenzabschnitt, (nt 9-20) dessen Komplement 
partial dem RAP1 binding element von Saccharomyces cerevisiae errtspricht (siehe z.B. Johnston, M. und Carlson, M. 
(1992) pp.193-281 in The molecular biology and cellular biology of the yeast Saccharomyces: Gene expression, Cold 

35 Spring Harbor Laboratory Press). Die so konstruierte Promotorkassette kann als einfach portierbares Expressionsignal 
vor jedes beliebige Gen fur die Uberexpression in Ashbya gossypii gesetzt werden und fuhrt zu deutlicher Gberexpres- 
sion von Genen in Ashbya gossypii, wie gezeigt in Beispiel 1 1 . 

Beispiel 10: 

40 

Konstruktion von Plasmiden mit Genen unter Kbntrolle des GAP-Promotors aus Ashbya gossypii 

[0070] Zur Einfugung der GAP-Promotorkassette 5i der kodierenden Region des AgADE4 Gens wurde nach Oblichen 
Methode (z.B. Clover, D.M. und Hames, B.D. (1995) DNA cloning Vol.1, IRL press) 8 bp 5' des ATG Startcodons eine 
45 singuiare Notl Schnittstelle (Erkennungssequenz GCGGCCGC) eingefuhrt. 

[0071 ] Die GAP-Promotorkassette kann dann uber Notl in diese Position eingefugt werden. Analog kann man vorge- 
hen bei der Klonierung der GAP-Promotorkassette 5' der kodierenden Region der Gene AgKPRI , AgGUAl , AgGUA2 
sowie bei Varianten der Gene AgADE4, AgKPRI , AgGUAl und AgGUA2. 

[0072] In Ashbya gossypii wird die Expression der Gene, die die GAP-Promotorkassette 5' der kodierenden Region 
so tragen durch den GAP -Promotor kontrolliert. 

Beispiel 1 1 : 

Uberexpression Genen in Ashbya gossypii unter Kontrolle des GAP-Promotors 

55 

[0073] Die Transformation von Ashbya gossypii mit den in Beispiel 10 beschriebenen DNA-Konstrukten kann man 
durchfuhren wie in Beispiel 6 beschrieben. Als Empfanger konnen bevorzugt, aber nicht ausschlieGlich, solche Klone 
dienen, die vor der hier durchzufOhrenden Transformation eine Disruption des zu uberexprimierenden Gens tragen. So 
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kann man z.B. die in Beispiel 6 beschriebene Mutante von Ashbya gossypii, die eine ade4::G418 Mutation tragt, mit 
einem in Beispiel 10 beschriebenen GAP-ADE4 Konstrukt transformieren. Man kann die Integration des Konstruktes in 
das Genom durch Southern-Blot -Analyse verifizieren. Die resultierenden Klone tragen kein G418 Resistenzgen mehr 
(sind somit G418 sensitiv) und sind Purin-prototroph. Die Uberexpression kann durch Northern-Blot-Analyse Oder 
5 Nachweis der enzymatischen Aktivitat (wie in Beispiel 12 beschrieben) nachgewiesen werden. Bei Expression des 
AgADE4 Gens unter dem naturiichen Promotor kann man 0.007 U/mg Protein nachweisen. Bei Expression des 
AgADE4 Gens unter dem GAP Promotor kann man 0,382 U/mg Protein nachweisen 

[0074] Ein Sequenzabschnitt der kodierenden Region des AgADE4 Gens kann als Sonde verwendet werden. Analog 
kann man mit AgKPRI , AgGUAl , AgGUA2 sowie bei Varianten all dieser Gene vorgehen. AuBerdem kann man Kom- 
w binationen aus einem dieser Gene, zusammen mit anderen Genen auf diese Weise in das Genom von Ashbya gossypii 
einbringen. 

[0075] Der Ashbya gossypii Wild-Typ hat eine spezifische PRPP Synthetase Aktivitat von 22 U/mg Protein (zur Ana- 
lytik der PRPP-Synthetase siehe Beispiel 13). Bei Expression des AgKPRI -Gens unter dem GAP-Promotor kann man 
855 U/mg Protein nachweisen. 

75 

Beispiel 12: 

[0076] Varianten des AgADE4 Genproduktes (Glutamin-PRPP-Amidotransferase), die nicht mehr feedback durch 
Purine oder Zwischenprodukte der Purinsynthese gehemmt werden. 

20 [0077] Glutamin-PRPP-Amidotransferasen werden durch Purin-NuWeotide feedback inhibiert. Diese Inhibition findet 
man in zahlreichen Organismen (siehe z.B. Switzer, R.L. (1989) Regulation of bacterial Glutamine Phosphoribosylpy- 
rophosphate Amidotransferase, in: Allosteric enzymes pp. 129-151, CRC press, Boca Raton). 
[0078] Die Glutamin-PRPP-Amidotransferase aus Ashbya gossypii wird ebenfalls durch AMP oder GMP gehemmt 
(siehe Abbildung ). Die Aktivitat der Glutamin Phosphoribosylpyrophosphat Amidotransferase aus Ashbya gossypii 

25 kann man messen, wie beschrieben in Messenger und Zalkin (1979) J. Biol. Chem. 254, Seite 3382-3392. 

[0079] Man kann veranderte Glutamin Phosphoribosylpyrophosphat Amidotransferasen konstruieren, die nicht mehr 
durch Purine gehemmt werden. Es ist offensichtlich, daB die Uberexpression solch deregulrerter Enzyme den Purin- 
stoffwechsel deutlich mehr verstarken als die Uberexpression der feedback inhibierten Enzyme. veranderungen der 
Sequenz des AgADE4 Gens konnen nach Oblichen Methoden (z.B. Clover, D.M. und Hames, B.D. (1995) DNA cloning 

30 Vol.1 , IRL press) vorgenommen werden. Man kann z.B. folgende Aminosauren der Glutamin Phosphoribosylpyrophos- 
phat Amidotransferase ausgetauschen: 

[0080] Das Codon, das fur Aspartat an der Position 310 kodiert, kann durch ein Codon ersetzt werden, das fur Valin 
kodiert. Das Codon, das fur Lysin an der Position 333 kodiert, kann durch ein Codon ersetzt werden, das fur Alanin 
kodiert. Das Codon, das fur Alanin an der Position 417 kodiert, kann durch ein Codon ersetzt werden, das fur Trypto- 
35 phan kodiert. Zusatzlich konnen AgADE4 Gene konstruiert werden, die Kombinationen dieser Austausche tragen. 
[0081] Alle Enzyme, die den D310V, den K333A, den A417W oder jede Kombination von Austauschen tragen, die 
D310V oder K333A enthalien, zeigen verringerte feedback inhibition durch AMP und GMP (siehe Abbildung ). Dies 
kann z.B. nach Expression der Enzyme in Ashbya gossypii (siehe Beispiel 1 1) gezetgt werden. 

40 Beispiel 13: 

[0082] Varianten des AgKPRI Genproduktes (PRPP-Synthetase), die nicht mehr feedback durch Purine oder Zwi- 
schenprodukte der Purinsynthese gehemmt werden. 

[0083] PRPP-Synthetasen werden feedback durch Purine, Pyrimidine und Aminosauren inhibiert. Diese Inhibition fin- 
45 det man in zahlreichen Organismen (siehe z.B. Gibson, K.J. et al. (1982) J. Biol. Chem. 257, 2391-2396; Tatibana, M. 
et al. (1995) Adv., Enzyme Regul. 35, 229-249 und darin zitierte Arbeiten). 

[0084] In der Forschung der Winischen Medizin sind Falle erblicher Gicht beschrieben, deren Basis eine verstarkte 
Purinbiosynthese ist. Die molekulare Ursache hierfur ist eine sogenannte Superaktivitat der humanen PRPP Synthe- 
tase (siehe z.B. Amer. J. Med. 55 (1973) 232-242; J. Clin. Invest. 96 (1995) 2133-2141; J. Biol. 268 (1993) 26476- 
50 26481). Die Basis hierfur kann eine Mutation sein, die dazu fuhrt, daB das Enzym nicht mehr durch Purine feedback 
inhibiert wird. 

Die Aktivitat der PRPP Synthetase aus Ashbya gossypii kann man messen wie in Anal. Biochem. 98 (1979) 254-263 
Oder J. Bacterid. 1 74 (1 992) 6852-6856 beschrieben. Die spezifische Aktivitat (U/mg) wird uber die Menge an entstan- 
denem Produkt definiert (nmol/min/mg Protein). 
55 Man kann veranderte PRPP Synthetasen konstruieren. die nicht mehr durch Purine gehemmt werden. Es ist offensicht- 
lich, daB die Uberexpression solch deregulierter Enzyme den Purinstoffwechsel deutlich mehr verstarkt als die Uber- 
expression der feedback inhibierten Enzyme. Veranderungen der Sequenz des AgKPRI Gens konnen nach Oblichen 
Methoden (z.B. Glover, D.M. und Hames. B.D. (1995) DNA cloning Vol. 1, IRL press) vorgenommen werden. Man kann 
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z.B. folgende Aminosauren der PRPP Synthetase austauschen: 

Das Codon, das fur Leucin an der Position 131 kodiert, kann durch ein Codon ersetzt werden. das fur Isoleucin kodiert. 
Das Codon, das fur Histidin an der Position 1 96 kodiert, kann durch ein Codon ersetzt werden, das fur Glutamin kodiert. 
Alle Enzyme, die einen dieser Aminosaureaustausche (L 131 oder H196Q) tragen, zeigen verringerte feedback Hem- 
5 mung durch Purine. In Abbildung 2 ist dies gezeigt am Beispiel ADR 

Dies kann gezeigt werden, nachdem die entsprechenden Enzyme in Ashbya gossypii exprimiert wurden. Dies kann 
entsprechend Beispiel 1 1 durchgefiihrt werden. 

Beispiel 14: 

10 

[0085] Varianten des AgGUAl Genproduktes (IMP-Dehydrogenase), die nicht mehr feedback durch Purine oder Zwi- 
schenprodukte der Purinsynthese gehemmt werden. 

Beispiel 15: 

15 

Auswirkung der Verstarkung und/oder der Optimierung von Purinstoffwechsel- Enzymen und deren Gene auf die Rib- 
oflavin-Produktion in Ashbya gossypii 

[0086] Man kann den Ausgangsstamm Ashbya gossypii ATCC1 0895, in Vergleich mit davon abgeleiteten Klonen, die 
so chromosomale Kopien von Genen, unter Kontrolle des GAP Promotors tragen (wie in Beispiel 11 beschrieben), im 
Schuttelkolben auf Riboflavin- Produktivitat prufen. Man kann dazu 300 ml SchOttelkolben, mit 20 ml YPD Medium 
(Sambrook. J. etal. (1989) Molecular cloning: a laboratory manual, Cold Spring Harbor Laboratory Press) bei einer 
Inkubationstemperatur von 28°C einsetzen. 

[0087] Nach 2 Tagen produziert der Kontrollstamm durchschnittlich 1 4,5 mg Riboflavin pro I KulturbrOhe. Stamme, die 
25 Gene fur Purinstoffwechsel- Enzyme uberexprimieren (wie z.B. in Beispiel 1 1 gezeigt) oder Gene fur optimierte Purin- 
stoffwechsel-Enzyme (z.B. wie in den Beispielen 12, 13 ,und 14 ) uberexprimieren. produzieren mehr Riboflavin. So 
produziert der Stamm, der AgADE4D310VK333A (Beispiel 12) uberexprimiert, in 2 Tagen durchschnittlich 45,4 mg Rib- 
oflavin pro I KulturbrOhe. 

[0088] Der Stamm, der AgKPRI unter dem GAP-Promotor uberexprimiert, produziert statt 14 mg/l (wie der WT) 36 
30 mg/l Riboflavin. Der Stamm, der AgKPRI H1 96Q unter dem GAP-Promotor uberexprimiert, produziert 51 mg/l Ribofla- 
vin. 

Abbildung 1 : 

35 [0089] Messung der Aktivitat der Gln-PRPP-Amidotransferase aus A. gossypii und von veranderten Formen des 
Enzyms in Abhangigkeit der Konzentration von Adenosin-5'-Monophosphat (AMP) und Guanosin-5'-Monophosphat 
(GMP). 

WT: Gln-PRPP-Amidotransferase 
40 A418W: Gln-PRPP-Amidotransferase, Alanin an Position 418 ausgetauscht gegen Tryptophan. 
K333A: Gln-PRPP-Amidotransferase, Lysin an Position 333 ausgetauscht gegen Alanin. 

D310VK333A: Gln-PRPP-Amidotransferase, Aspartat an Position 310 ausgetauscht gegen Valin und Lysin an 
Position 333 ausgetauscht gegen Alanin. 

45 Abbildung 2: 

[0090] Messung der Aktivitat der PRPP Synthetase aus A. gossypii und von veranderten Formen des Enzymes in 
Abhangigkeit der Konzentration von Adenosin.S'-Diphosphat (ADP) 

so WT: PRPP Synthetase 

L131 1: PRPP Synthetase, Leucin an Position 131 ausgetauscht gegen Isoleucin 
H196Q: PRPP Synthetase. Histidin an Position 196 ausgetauscht gegen Glutamin 

H196Q, L131I: PRPP Synthetase, Histidin an Position 196 ausgetauscht gegen Glutamin und Leucin an Position 
131 ausgetauscht gegen Isoleucin 
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SEQUENZ PROTOKOLL 

(1) ALGEMEINE INFORMATION: 

(i) ANMELDER: 

(A) NAME: BASF Aktiengesellschaf t 

(B) STRASSE: Carl-Bosch-Strasse 38 

(C) ORT: Ludwigshaf en 

(E) LAND: Bundesrepublik Deutschland 

(F) POSTLEITZAHL: D-67056 

(G) TELEPHON: 0621/6048526 

(H) TELEFAX: 0621/6043123 

(I) TELEX: 1762175170 

(ii) ANMELDETITEL : Gene der Purinbiosyn these aus Ashbya gossypii 
und deren Verwendung in der mikrobiellen 
Ribof lavinbiosyn these 

(iii) ANZAHL DER SEQUENZEN: 13 

(iv) COMPUTER-LESBARE FORM: 

(A) DATENTRAGER: Floppy disk 

(B) COMPUTER: IBM PC compatible 

(C) BETRIEBSS YSTEM : PC-DOS /MS-DOS 

(D) SOFTWARE: Patentln Release #1.0. Version #1.25 (EPA) 

(2) INFORMATION ZU SEQ ID NO: 1: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 1911 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 
(iii) HYPOTHETISCH: NEIN 
(iii) ANTISENSE: NEIN 

(ix) MERKMALE : 

(A) NAME/SCHLUSSEL: 5'UTR 

(B) LAGE : 1..625 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 626.. 1582 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: 3'UTR 

(B) LAGE: 1583.. 1911 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 1: 

GGTAGTCGCT CATCGACAGA CACAATCGCG TGTTCTCTCT GAATCGTCCA TTGGGTGTCA 60 

5 GCATCCTGAT CGCGGGCGGA TGGAATGGGT AATCATTAGG AAACACCAAT GTCCCATGGT 120 

ATTGTCCGTC CTCGTATGGT GTCTCAGGAG GACCCGTGAT CACGTAGTGC CACACCAGGA 180 

TATTGTCTTC CTTTGGTGCT GCCACGATGT AGGGC GGGGG GTTCTCGGTC ATCATTTTGT 24 0 

70 

ACTCCTTTGA GAGCCGCTTG TACGCCTGTC TTGATGCCAT CTTGCCTACT ATTAGTTTCT 300 

CACCACTTCC CGCCAAACAA TCTGCACTTT ACGAGCGCTA TCTATCCCTC GGGTCGCTCT 360 

J5 AGTTGATTAT TGGCGAAACT GATAGTTCAG GT AC TTC CAT GATGCGGTCA TATCCACGTA 420 

TGTGATC AC G TGATCATCAG CCATGCTGCC AGCTCACGGG CCTGCCTACA CTATTGGAGG 480 

CTCTGTGAGT CATGATTTAT TGCATATCAA GCCCAGATAG TCGTTGGGGA TACTACCGTT 54 0 

20 GCCGCGATGA GC TC C GAT AT TAAGTTGTAG CCAAAAATTT TAACGGATGA CTTCTTAACA 600 

GTTATTGACG CCGCAATCCT ACGCC ATG TCG TCC AAT AGC ATA AAG CTG CTA 652 

Met Ser Ser Asn Ser He Lys Leu Leu 
1 5 

25 

GCA GGT AAC TCG CAC CCG GAC CTA GCT GAG AAG GTC TCC GTT CGC CTA 700 

Ala Gly Asn Ser His Pro Asp Leu Ala Glu Lys Val Ser Val Arg Leu 
10 15 20 25 

30 GGT GTA CCA CTT TCG AAG ATT GGA GTG TAT CAC TAC TCT AAC AAA GAG 74 8 

Gly Val Pro Leu Ser Lys He Gly Val Tyr His Tyr Ser Asn Lys Glu 
30 35 40 

ACG TCA GTT ACT ATC GGC GAA AGT ATC CGT GAT GAA GAT GTC TAC ATC 796 
35 Thr Ser Val Thr He Gly Glu Ser He Arg Asp Glu Asp Val Tyr He 

45 50 55 

ATC CAG ACA GGA ACG GGG GAG CAG GAA ATC AAC GAC TTC CTC ATG GAA 844 
He Gin Thr Gly Thr Gly Glu Gin Glu He Asn Asp Phe Leu Met Glu 
40 60 65 70 

CTG CTC ATC ATG ATC CAT GCC TGC CGG TCA GCC TCT GCG CGG AAG ATC 892 
Leu Leu He Met He His Ala Cys Arg Ser Ala Ser Ala Arg Lys He 
75 80 85 

45 

ACA GCG GTT ATA CCA AAC TTC CCT TAC GCA AGA CAA GAC AAA AAG GAC 940 
Thr Ala Val He Pro Asn Phe Pro Tyr Ala Arg Gin Asp Lys Lys Asp 
90 95 100 105 

50 AAG TCG CGA GCA CCG ATA ACT GCC AAG CTG GTG GCC AAG ATG CTA GAG 988 

Lys Ser Arg Ala Pro He Thr Ala Lys Leu Val Ala Lys Met Leu Glu 
110 115 120 
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ACC GCG GGG TGC AAC CAC GTT ATC ACG ATG GAT TTG CAC GCG TCT CAA 
Thr Ala Gly Cys Asn His Val He Thr Met Asp Leu His Ala Ser Gin 
125 130 135 

ATT CAG GGT TTC TTC CAC ATT CCA GTG GAC AAC CTA TAT GCA GAG CCG 
He Gin Gly Phe Phe His lie Pro Val Asp Asn Leu Tyr Ala Glu Pro 
140 145 150 

AAC ATC CTG CAC TAC ATC CAA CAT AAT GTG GAC TTC CAG AAT AGT ATG 
Asn He Leu His Tyr He Gin His Asn Val Asp Phe Gin Asn Ser Met 
155 160 165 

TTG GTC GCG CCA GAC GCG GGG TCG GCG AAG CGC ACG TCG ACG CTT TCG 
Leu Val Ala Pro Asp Ala Gly Ser Ala Lys Arg Thr Ser Thr Leu Ser 
170 175 180 185 

GAC AAG CTG AAT CTC AAC TTC GCG TTG ATC CAC AAA GAA CGG CAG AAG 
Asp Lys Leu Asn Leu Asn Phe Ala Leu He His Lys Glu Arg Gin Lys 
190 195 200 

GCG AAC GAG GTC TCG CGG ATG GTG TTG GTG GGT GAT GTC GCC GAC AAG 
Ala Asn Glu Val Ser Arg Met Val Leu Val Gly Asp Val Ala Asp Lys 
205 210 215 

TCC TGT ATT ATT GTA GAC GAC ATG GCG GAC ACG TGC GGA ACG CTA GTG 
Ser Cys He He Val Asp Asp Met Ala Asp Thr Cys Gly Thr Leu Val 
220 225 230 

AAG GCC ACT GAC ACG CTG ATC GAA AAT TGT GCG AAA GAA GTG ATT GCC 
Lys Ala Thr Asp Thr Leu He Glu Asn Cys Ala Lys Glu Val He Ala 
235 240 245 

ATT GTG ACA CAC GGT ATA TTT TCT GGC GGC GCC CGC GAG AAG TTG CGC 
He Val Thr His Gly He Phe Ser Gly Gly Ala Arg Glu Lys Leu Arg 
250 255 260 265 

AAC AGC AAG CTG GCA CGG ATC GTA AGC ACA AAT ACG GTG CCA GTG GAC 
Asn Ser Lys Leu Ala Arg He Val Ser Thr Asn Thr Val Pro Val Asp 
270 275 280 

CTC AAT CTA GAT ATC TAC CAC CAA ATT GAC ATT AGT GCC ATT TTG GCC 
Leu Asn Leu Asp He Tyr His Gin He Asp He Ser Ala He Leu Ala 
285 290 295 

GAG GCA ATT AGA AGG CTT CAC AAC GGG GAA AGT GTG TCG TAC CTG TTC 
Glu Ala He Arg Arg Leu His Asn Gly Glu Ser Val Ser Tyr Leu Phe 
300 305 310 

AAT AAC GCT GTC ATG TAGTGCTGTC AGTGGCAGAT GCATGATCGC TGGCCTAATT 
Asn Asn Ala Val Met 
315 

ATC TGTGTAA GTTGATACAA TGCAGTAAAT ACAGTACATA AAACTGAATG TTTTTCACTT 
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AGGGGTGCTT TGTTGTTCTG ATAGCGTGTG TGC GAATTTG GAGGTGAAAG TTGAACATCA 1739 

CGTAATGAAT ACAAACAAGA TTGCACATTA GGAAAAGCGA TAAATTATTT ATTATTTGCA 1799 

ACTGGCCTTT GAGCGTTTAA GCCTGAACAT TTTTGCCCTT TTGTTTGACC GTACCGTTAT 1859 

CACTCGTCCT TATATATGGC TATCCTTCTC TTCCGGAACT TCTTCGAGCG TA 1911 
(2) INFORMATION ZU SEQ ID NO : 2: 

(i) SEQUENZ CHARAKTERISTIKA : 

(A) LANGE: 318 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii> ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO : 2: 

Met Ser Ser Asn Ser lie Lys Leu Leu Ala Gly Asn Ser His Pro Asp 
15 10 15 

Leu Ala Glu Lys Val Ser Val Arg Leu Gly Val Pro Leu Ser Lys He 
20 25 30 

Gly Val Tyr His Tyr Ser Asn Lys Glu Thr Ser Val Thr He Gly Glu 
35 40 45 

Ser He Arg Asp Glu Asp Val Tyr He He Gin Thr Gly Thr Gly Glu 
50 55 60 

Gin Glu He Asn Asp Phe Leu Met Glu Leu Leu He Met He His Ala 
65 70 75 80 

Cys Arg Ser Ala Ser Ala Arg Lys He Thr Ala Val He Pro Asn Phe 
85 90 95 

Pro Tyr Ala Arg Gin Asp Lys Lys Asp Lys Ser Arg Ala Pro He Thr 
100 105 110 

Ala Lys Leu Val Ala Lys Met Leu Glu Thr Ala Gly Cys Asn His Val 
115 120 125 

He Thr Met Asp Leu His Ala Ser Gin He Gin Gly Phe Phe His He 
130 135 140 

Pro Val Asp Asn Leu Tyr Ala Glu Pro Asn He Leu His Tyr He Gin 
145 150 155 160 

His Asn Val Asp Phe Gin Asn Ser Met Leu Val Ala Pro Asp Ala Gly 
165 170 175 

Ser Ala Lys Arg Thr Ser Thr Leu Ser Asp Lys Leu Asn Leu Asn Phe 
180 185 190 
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Ala Leu lie His Lys Glu Arg Gin Lys Ala Asn Glu Val Ser Arg Met 
195 200 205 

Val Leu Val Gly Asp Val Ala Asp Lys Ser Cys lie lie Val Asp Asp 
210 215 220 

Met Ala Asp Thr Cys Gly Thr Leu Val Lys Ala Thr Asp Thr Leu lie 
225 230 235 240 

Glu Asn Cys Ala Lys Glu Val He Ala He Val Thr His Gly lie Phe 
245 250 255 

Ser Gly Gly Ala Arg Glu Lys Leu Arg Asn Ser Lys Leu Ala Arg He 
260 265 270 

Val Ser Thr Asn Thr Val Pro Val Asp Leu Asn Leu Asp He Tyr His 
275 280 285 

Gin He Asp He Ser Ala He Leu Ala Glu Ala He Arg Arg Leu His 
290 295 300 

Asn Gly Glu Ser Val Ser Tyr Leu Phe Asn Asn Ala Val Met 
305 310 315 

(2) INFORMATION ZU SEQ ID NO: 3: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 5369 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 
(iii) HYPOTHETISCH: NEIN 
(iii) ANTI SENSE : NEIN 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: 5'UTR 

(B) LAGE: 1 . . 54 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 55.. 1482 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 1767.. 3299 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 3588. .4703 
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(ix) MERKMALE : 

(A) NAME/SCHLUSSEL: 3 ' UTR 

(B) LAGE : 4704. .5369 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 3: 

AAGCTTGACC TTGGCTGGCA CTTGAGTCGG CAGACAGGTG GACTAACCCG AGCA ATG 

Met 



GAT CGT GGT TGT AAA GGT ATC TCT TAT GTG CTC AGT GCA ATG GTT TTT 
Asp Arg Gly Cys Lys Gly lie Ser Tyr Val Leu Ser Ala Met Val Phe 
5 10 15 

CAC ATA ATA CCG ATT ACA TTT GAA ATA TCG ATG GTA TGT GGC ATA TTG 
His lie lie Pro lie Thr Phe Glu He Ser Met Val Cys Gly He Leu 
20 25 30 

ACA TAC CAG TTT GGT GCT TCC TTC GCT GCT ATA ACA TTC TCG ACT ATG 
Thr Tyr Gin Phe Gly Ala Ser Phe Ala Ala He Thr Phe Ser Thr Met 
35 40 45 

CTT CTT TAC TCC ATC TTT ACT TTC AGA ACG ACG GCG TGG CGC ACA CGG 
Leu Leu Tyr Ser He Phe Thr Phe Arg Thr Thr Ala Trp Arg Thr Arg 
50 55 60 65 

TTT AGG CGT GAT GCG AAC AAG GCT GAC AAT AAG GCC GCT AGT GTG GCA 
Phe Arg Arg Asp Ala Asn Lys Ala Asp Asn Lys Ala Ala Ser Val Ala 
70 75 80 

TTG GAT TCC CTA ATA AAT TTT GAA GCT GTA AAG TAT TTC AAT AAC GAG 
Leu Asp Ser Leu He Asn Phe Glu Ala Val Lys Tyr Phe Asn Asn Glu 
85 90 95 

AAG TAC CTT GCG GAC AAG TAT CAC ACA TCC TTG ATG AAG TAC CGG GAT 
Lys Tyr Leu Ala Asp Lys Tyr His Thr Ser Leu Met Lys Tyr Arg Asp 
100 105 110 

TCC CAG ATA AAG GTC TCG CAA TCG CTG GCG TTT TTG AAC ACC GGC CAG 
Ser Gin He Lys Val Ser Gin Ser Leu Ala Phe Leu Asn Thr Gly Gin 
115 120 125 

AAC CTA ATT TTT ACC ACT GCA CTG ACT GCA ATG ATG TAT ATG GCC TGT 
Asn Leu He Phe Thr Thr Ala Leu Thr Ala Met Met Tyr Met Ala Cys 
130 135 140 145 

AAT GGT GTT ATG CAG GGC TCT CTT ACA GTG GGG GAT CTT GTG TTA ATT 
Asn Gly Val Met Gin Gly Ser Leu Thr Val Gly Asp Leu Val Leu He 
150 155 160 

AAT CAA CTG GTA TTC CAG CTC TCC GTG CCA CTA AAC TTC CTT GGT AGC 
Asn Gin Leu Val Phe Gin Leu Ser Val Pro Leu Asn Phe Leu Gly Ser 
165 170 175 
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GTC TAC CGT GAT CTC AAG CAG TCT CTG ATA GAT ATG GAA TCT TTA TTT 
Val Tyr Arg Asp Leu Lys Gin Ser Leu lie Asp Mec Glu Ser Leu Phe 

180 185 190 

AAA CTG CAA AAA AAT CAG GTC ACA ATT AAG AAC TCC CCA AAT GCC CAG 

Lys Leu Gin Lys Asn Gin Val Thr lie Lys Asn Ser Pro Asn Ala Gin 

195 200 205 

AAC CTA CCA ATA CAC AAA CCG TTG GAT ATT CGC TTT GAA AAT GTT ACG 

Asn Leu Pro He His Lys Pro Leu Asp He Arg Phe Glu Asn Val Thr 

210 215 220 225 

TTT GGC TAT GAC CCG GAG CGG CGT ATA TTG AAC AAT GTT TCG TTT ACC 

Phe Gly Tyr Asp Pro Glu Arg Arg He Leu Asn Asn Val Ser Phe Thr 

230 235 240 

ATC CCA GCT GGA ATG AAG ACT GCC ATA GTA GGC CCA TCG GGC TCG GGG 

lie Pro Ala Gly Met Lys Thr Ala He Val Gly Pro Ser Gly Ser Gly 

245 250 255 

AAG TCC ACC ATT TTG AAG CTC GTA TTT AGA TTC TAT GAG CCC GAG CAA 

Lys Ser Thr He Leu Lys Leu Val Phe Arg Phe Tyr Glu Pro Glu Gin 

260 265 270 

GGT CGT ATC CTA GTT GGC GGC ACA GAT ATC CGC GAT TTA GAC TTG CTT 

Gly Arg He Leu Val Gly Gly Thr Asp He Arg Asp Leu Asp Leu Leu 

275 280 285 

TCT TTA CGG AAG GCT ATC GGT GTC GTG CCC CAA GAT ACT CCT CTC TTC 

Ser Leu Arg Lys Ala He Gly Val Val Pro Gin Asp Thr Pro Leu Phe 

290 295 300 305 

AAT GAC ACA ATC TGG GAG AAT GTT AAA TTC GGC AAT ATC AGT TCC TCT 

Asn Asp Thr He Trp Glu Asn Val Lys Phe Gly Asn He Ser Ser Ser 

310 315 320 

GAC GAT GAG ATT CTC AGG GCC ATA GAA AAA GCT CAA CTC ACG AAG CTA 

Asp Asp Glu He Leu Arg Ala He Glu Lys Ala Gin Leu Thr Lys Leu 

325 330 335 

CTC CAG AAC CTA CCA AAG GGC GCT TCC ACC GTT GTA GGG GAG CGC GGT 

Leu Gin Asn Leu Pro Lys Gly Ala Ser Thr Val Val Gly Glu Arg Gly 

340 345 350 

TTG ATG ATC AGC GGA GGT GAG AAA CAA AGG CTT GCT ATT GCT CGT GTG 

Leu Met He Ser Gly Gly Glu Lys Gin Arg Leu Ala He Ala Arg Val 

355 360 365 

CTT TTG AAG GAC GCT CCG CTG ATG TTT TTC GAC GAG GCT ACA AGT GCT 

Leu Leu Lys Asp Ala Pro Leu Met Phe Phe Asp Glu Ala Thr Ser Ala 

370 375 380 385 
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CTG GAT AC A CAC ACA GAG CAG GCA CTC TTG CAC ACC ATT CAG CAG AAC 1257 
Leu Asp Thr His Thr Glu Gin Ala Leu Leu His Thr lie Gin Gin Asn 
390 395 400 

TTT TCT Tcc ^ T TCA aag ACG AGC GTT TAC GTT GCC CAT AGA CTG CGC 1305 
Phe Ser Ser Asn Ser Lys Thr Ser Val Tyr Val Ala His Arg Leu Arg 
405 410 415 

ACA ATC GCT GAT GCA GAT AAG ATC ATT GTT CTT GAA CAA GGT TCT GTC 1353 
Thr lie Ala Asp Ala Asp Lys He He Val Leu Glu Gin Gly Ser Val 
420 425 430 

CGC GAA GAG GGC ACA CAC AGC TCG CTG TTA GCG TCA CAA GGA TCC CTA 1401 
Arg Glu Glu Gly Thr His Ser Ser Leu Leu Ala Ser Gin Gly Ser Leu 
435 440 445 

TAC CGG GGT CTG TGG GAT ATT CAG GAA AAC CTA ACG CTT CCG GAA CGG 1449 
Tyr Arg Gly Leu Trp Asp He Gin Glu Asn Leu Thr Leu Pro Glu Arg 
450 455 460 465 

CCT GAG CAG TCA ACC GGA TCT CAG CAT GCA TAGACGTCTG ACTAGAGATT 1499 
Pro Glu Gin Ser Thr Gly Ser Gin His Ala 
470 475 

ATATAATAAC CCTCGAGCCA AAATTATACG GCGCTAACAA GTAAAAATTT TAGTTACTTT 1559 

TCTGACTTCT CTACGCTGAC TTCTCTACCC TTCTAACATA GTTAATTGAA GTAGTGGTTA 1619 

ATGACGACTG CATTTTATTA TTGTCCACTT TGCATTAGAA GTACTAGTGC TTAAGCGCTC 1679 

TTTAGGCCGC TTTCTTCTTC TTTGTCAGGC CGCAAGGTAA AGGAAGCACC AACGGATTGC 1739 

TACCGCTGCT ATTCCTGCTC TCTCAAG ATG TGT GGC ATA TTA GGC GTT GTG 179 0 

Met Cys Gly He Leu Gly Val Val 
1 5 

CTA GCC GAT CAG TCG AAG GTG GTC GCC CCT GAG TTG TTT GAT GGC TCA 1838 
Leu Ala Asp Gin Ser Lys Val Val Ala Pro Glu Leu Phe Asp Gly Ser 
10 15 20 

CTG TTC TTA CAG CAT CGC GGT CAA GAT GCT GCC GGG ATT GCT ACG TGC 1886 
Leu Phe Leu Gin His Arg Gly Gin Asp Ala Ala Gly He Ala Thr Cys 
25 30 35 40 

GGC CCC GGT GGG CGC TTG TAC CAA TGT AAG GGC AAT GGT ATG GCA CGG 19 34 

Gly Pro Gly Gly Arg Leu Tyr Gin Cys Lys Gly Asn Gly Met Ala Arg 
45 50 55 

GAC GTG TTC ACG CAA GCT CGG ATG TCA GGG TTG GTT GGC TCT ATG GGG 1982 
Asp Val Phe Thr Gin Ala Arg Met Ser Gly Leu Val Gly Ser Met Gly 
60 65 70 
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ATT GCA CAC CTG AGA TAT CCC ACT GCA GGC TCC AGT GCG AAC TCA GAA 
lie Ala His Leu Arg Tyr Pro Thr Ala Gly Ser Ser Ala Asn Ser Glu 
75 80 85 

GCG CAG CCA TTC TAT GTG AAT AGT CCC TAC GGA ATT TGC ATG AGT CAT 
Ala Gin Pro Phe Tyr Val Asn Ser Pro Tyr Gly lie Cys Met Ser His 
90 95 100 

AAT GGT AAT CTG GTG AAC ACG ATG TCT CTA CGT AGA TAT CTT GAT GAA 
Asn Gly Asn Leu Val Asn Thr Met Ser Leu Arg Arg Tyr Leu Asp Glu 
105 110 115 120 

GAC GTT CAC CGT CAT ATT AAC ACG GAC AGC GAT TCT GAG CTA CTG CTT 
Asp Val His Arg His lie Asn Thr Asp Ser Asp Ser Glu Leu Leu Leu 
125 130 135 

AAT ATA TTT GCC GCG GAG CTG GAA AAG TAC AAC AAA TAT CGT GTG AAC 
Asn lie Phe Ala Ala Glu Leu Glu Lys Tyr Asn Lys Tyr Arg Val Asn 
140 145 150 

AAC GAT GAT ATA TTT TGT GCT CTA GAG GGT GTT TAC AAA CGT TGT CGC 
Asn Asp Asp lie Phe Cys Ala Leu Glu Gly Val Tyr Lys Arg Cys Arg 
155 160 165 

GGT GGC TAT GCT TGT GTT GGC ATG TTG GCG GGA TAT GGA TTG TTT GGT 
Gly Gly Tyr Ala Cys Val Gly Met Leu Ala Gly Tyr Gly Leu Phe Gly 
170 175 180 

TTC CGG GAC CCC AAT GGG ATC AGG CCG CTA TTG TTT GGT GAG CGC GTC 
Phe Arg Asp Pro Asn Gly lie Arg Pro Leu Leu Phe Gly Glu Arg Val 
185 190 195 200 

AAC GAT GAC GGC ACC ATG GAC TAC ATG CTA GCG TCC GAA AGT GTC GTT 
Asn Asp Asp Gly Thr Met Asp Tyr Met Leu Ala Ser Glu Ser Val Val 
205 210 215 

CTT AAG GCC CAC CGC TTC CAA AAC ATA CGT GAT ATT CTT CCC GGC CAA 
Leu Lys Ala His Arg Phe Gin Asn lie Arg Asp lie Leu Pro Gly Gin 
220 225 230 

GCC GTC ATT ATC CCT AAA ACG TGC GGC TCC AGT CCA CCA GAG TTC CGG 
Ala Val lie lie Pro Lys Thr Cys Gly Ser Ser Pro Pro Glu Phe Arg 
235 240 245 

CAG GTA GTG CCA ATT GAG GCC TAC AAA CCG GAC TTG TTT GAG TAC GTG 
Gin Val Val Pro lie Glu Ala Tyr Lys Pro Asp Leu Phe Glu Tyr Val 
250 255 260 

TAT TTC GCT CGT GCT GAC AGC GTT CTG GAC GGT ATT TCC GTT TAC CAT 
Tyr Phe Ala Arg Ala Asp Ser Val Leu Asp Gly lie Ser Val Tyr His 
265 270 275 280 
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ACA CGC CTG TTG ATG GGT ATC AAA CTT GCC GAG AAC ATC AAA AAA CAG 
Thr Arg Leu Leu Met Gly lie Lys Leu Ala Glu Asn lie Lys Lys Gin 
285 290 295 

ATC GAT CTG GAC GAA ATT GAC GTT GTT GTA TCT GTT CCT GAC ACT GCA 
lie Asp Leu Asp Glu lie Asp Val Val Val Ser Val Pro Asp Thr Ala 
300 305 310 

CGT ACC TGT GCA TTG GAG TGT GCC AAC CAT TTA AAC AAA CCT TAT CGC 
Arg Thr Cys Ala Leu Glu Cys Ala Asn His Leu Asn Lys Pro Tyr Arg 
315 320 325 

GAA GGA TTT GTC AAG AAC AGA TAT GTT GGA AGA ACA TTT ATC ATG CCA 
Glu Gly Phe Val Lys Asn Arg Tyr Val Gly Arg Thr Phe He Met Pro 
330 335 340 

AAC CAA AAA GAG CGA GTA TCT TCT GTG CGC CGC AAG TTG AAC CCA ATG 
Asn Gin Lys Glu Arg Val Ser Ser Val Arg Arg Lys Leu Asn Pro Met 
345 350 355 360 

AAC TCA GAA TTT AAA GAC AAG CGC GTG CTG ATT GTC GAT GAT TCC ATT 
Asn Ser Glu Phe Lys Asp Lys Arg Val Leu He Val Asp Asp Ser He 
365 370 375 

GTG CGA GGT ACC ACT TCC AAA GAG ATT GTT AAC ATG GCG AAG GAA TCC 
Val Arg Gly Thr Thr Ser Lys Glu He Val Asn Met Ala Lys Glu Ser 
380 385 390 

GGT GCT GCC AAG GTC TAC TTT GCC TCT GCA GCG CCA GCA ATT CGT TTC 
Gly Ala Ala Lys Val Tyr Phe Ala Ser Ala Ala Pro Ala He Arg Phe 
395 400 405 

AAT CAC ATC TAC GGG ATT GAC CTA GCA GAT ACT AAG CAG CTT GTC GCC 
Asn His He Tyr Gly He Asp Leu Ala Asp Thr Lys Gin Leu Val Ala 
■ 410 415 420 

TAC AAC AGA ACT GTT GAA GAA ATC ACT GCG GAG CTG GGC TGT GAC CGC 
Tyr Asn Arg Thr Val Glu Glu He Thr Ala Glu Leu Gly Cys Asp Arg 
425 430 435 440 

GTC ATC TAT CAA TCT TTG GAT GAC CTC ATC GAC TGT TGC AAG ACA GAC 
Val He Tyr Gin Ser Leu Asp Asp Leu He Asp Cys Cys Lys Thr Asp 
445 450 455 

ATC ATC TCA GAA TTT GAA GTT GGA GTT TTC ACT GGT AAC TAC GTT ACA 
He He Ser Glu Phe Glu Val Gly Val Phe Thr Gly Asn Tyr Val Thr 
460 465 470 

GGT GTT GAG GAT GTG TAC TTG CAG GAA TTA GAA CGT TGC CGC GCT CTT 
Gly Val Glu Asp Val Tyr Leu Gin Glu Leu Glu Arg Cys Arg Ala Leu 
475 480 485 
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AAT AAC TCG AAT AAG GGT GAA GCG AAG GCC GAG GTT GAT ATT GGT CTC 3278 
Asn Asn Ser Asn Lys Gly Glu Ala Lys Ala Glu Val Asp lie Gly Leu 
490 495 500 

TAC AAT TCT GCC GAC TAT TAGCGGCGCC GTTGCCGGCA TCCGGCCCCA 3 326 
Tyr Asn Ser Ala Asp Tyr 
505 510 

TATATAGACT CATCGGGACC TAAAATAAGC CTTTACAGAT CATTATCTAC AAATATAGAT 3386 

ACCATTAAAA GCCTGACTTT CGACTTACTC CTAGCACACC CCGTTGTATC CCTGTGCTTG 344 6 

CTTTCTTAAA TGCCGTTGGT TAGGCTTTGG ACTTAGCGTC CCGCCCATTT TCTAGCATGT 3506 

GCAGATCTAG CAAATTTGGC CTAAGACAAG AAGATCCATT CGGCACCCAC ATCCTGGAGC 3566 

CAGCACACAG TGGACCCAGA C ATG AGC AGC GGC AAT ATA TGG AAG CAA TTG 3617 
Met Ser Ser Gly Asn lie Trp Lys Gin Leu 
15 10 

CTA GAG GAG AAT AGC GAA CAG CTG GAC CAG TCC ACT ACG GAG ACT TAC 3665 
Leu Glu Glu Asn Ser Glu Gin Leu Asp Gin Ser Thr Thr Glu Thr Tyr 
15 20 25 

GTG GTA TGC TGC GAG AAC GAA GAT TCC CTT AAC CAG TTT TTG CAA CAA 3713 
Val Val Cys Cys Glu Asn Glu Asp Ser Leu Asn Gin Phe Leu Gin Gin 
30 35 40 

TGT TGG CAG ATT GAC GAG GGC GAG AAG GTG ACC AAC CTG GAG CCG TTG 37 61 

Cys Trp Gin He Asp Glu Gly Glu Lys Val Thr Asn Leu Glu Pro Leu. 



GGA TTC TTT ACA AAG GTG GTT TCG CGC GAC GAA GAG AAC CTC CGG CTC 
Gly Phe Phe Thr Lys Val Val Ser Arg Asp Glu Glu Asn Leu Arg Leu 



AAC GTA TAC TAT GCC AAG AGC CCA CTG GAT GCA CAG ACG CTG CAG TTT 

Asn Val Tyr Tyr Ala Lys Ser Pro Leu Asp Ala Gin Thr Leu Gin Phe 
75 80 85 90 

CTG GGC GTG TTC CTG CGC CAA ATG GAA ACC TCA CAA ATA CGT TGG ATC 

Leu Gly Val Phe Leu Arg Gin Met Glu Thr Ser Gin He Arg Trp He 
95 100 105 

TTC CTA CTG GAC TGG CTG CTA GAC GAT AAA CGA TTA TGG CTA CGT CAA 

Phe Leu Leu Asp Trp Leu Leu Asp Asp Lys Arg Leu Trp Leu Arg Gin 
110 115 120 

CTG CGG AAC TCG TGG GCC GCC TTG GAG GAA GCG CAG GTG GCA CCC TTT 

Leu Arg Asn Ser Trp Ala Ala Leu Glu Glu Ala Gin Val Ala Pro Phe 

125 130 135 



BNSDOCID: iEP 0927761A2J_> 



EP 0 927 761 A2 



CCA GGT GGC GCT GTG GTG GTG GTC CTC AAC CCG AGT CAC GTG ACA CAA 
Pro Gly Gly Ala Val Val Val Val Leu Asn Pro Ser His Val Thr Gin 
140 145 150 

CTG GAG CGA AAC ACG ATG GTT TGG AAC TCC CGC CGT CTG GAC CTG GTA 
Leu Glu Arg Asn Thr Met Val Trp Asn Ser Arg Arg Leu Asp Leu Val 
155 160 165 170 

CAC CAG ACA CTG CGA GCT GCA TGC CTC AAC ACC GGC TCG GCG CTA GTT 
His Gin Thr Leu Arg Ala Ala Cys Leu Asn Thr Gly Ser Ala Leu Val 
175 180 185 

ACA CTT GAT CCT AAT ACT GCG CGC GAA GAC GTC ATG CAC ATA TGT GCG 
Thr Leu Asp Pro Asn Thr Ala Arg Glu Asp Val Met His lie Cys Ala 
190 195 200 

CTG CTT GCG GGG CTG CCT ACA TCC CGT CCC GTC GCG ATG CTA AGC CTG 
Leu Leu Ala Gly Leu Pro Thr Ser Arg Pro Val Ala Met Leu Ser Leu 
205 210 215 

CAA AGT CTA TTC ATC CCC CAC GGT GCA GAT TCC ATC GGC AAG ATC TGC 
Gin Ser Leu Phe lie Pro His Gly Ala Asp Ser lie Gly Lys lie Cys 
220 225 230 

ACC ATC GCG CCC GAG TTC CCT GTT GCT ACG GTG TTC GAC AAC GAT TTT 
Thr lie Ala Pro Glu Phe Pro Val Ala Thr Val Phe Asp Asn Asp Phe 
235 240 245 250 

GTG AGC TCG ACA TTC GAG GCC GCA ATT GCT CCA GAA CTT ACT CCA GGA 
Val Ser Ser Thr Phe Glu Ala Ala lie Ala Pro Glu Leu Thr Pro Gly 
255 260 265 

CCA CGT GTG CCA TCT GAC CAC CCA TGG CTA ACA GAG CCT ACC AAC CCC 
Pro Arg Val Pro Ser Asp His Pro Trp Leu Thr Glu Pro Thr Asn Pro 
270 275 280 

CCT TCG GAG GCA ACC GCT TGG CAT TTC GAT CTC CAA GGT CGC CTC GCT 
Pro Ser Glu Ala Thr Ala Trp His Phe Asp Leu Gin Gly Arg Leu Ala 
285 290 295 

ACC CTA TAC CGG CAT CTT GGT GAC TCT AAC AAG GCC ATA TCT GTT ACT 
Thr Leu Tyr Arg His Leu Gly Asp Ser Asn Lys Ala lie Ser Val Thr 
300 305 310 

CAG CAC CGC TTC CAC AAG CCC CGC TCG GAA GAT TAT GCA TAC GAA TTC 
Gin His Arg Phe His Lys Pro Arg Ser Glu Asp Tyr Ala Tyr Glu Phe 
315 320 325 330 

GAG CTG CCG TCT AAG CAC CCT ACA ATA CGT GAC CTC ATA CGC TCT GCC 
Glu Leu Pro Ser Lys His Pro Thr lie Arg Asp Leu He Arg Ser Ala 
335 340 345 
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GCA GCC GAC TCA CCG AAC GAC GTC GCT GAC TCC ATC GAT GGG CTT ATG 4673 
Ala Ala Asp Ser Pro Asn Asp Val Ala Asp Ser lie Asp Gly Leu Met 
350 355 360 

GAT GGT ATC GTA CAA AGG AAT GTT CAT TGACGTCGAC ACAAAAATTT 4720 
Asp Gly He Val Gin Arg Asn Val His 
365 370 

TGTTACTGTT CTCTCGAGAA CTATTCTCAT CCAGTACTGA CATATTAGAA GGC GAAGTGA 4780 

ACTAGGATTT ATATAAAGTA GCCTTCAGGC AATTGCACAG GGTCTATTGA GTCGCTGCCG 4840 

TTCACGAGAG AGCCCAATAT ATCGAGGACT AATTGGTCAC TTTTGTTTTG CTATACTCAC 4900 

CCTGTATTTG CTAATCATTT ATCCGCTTTG TCCAAGTGGT TGCGAAGATA TCGAGCCAGA 4960 

ACATTAGAAT CTGGTTTGCC GCATCCTAGA GCTGTCTCCA AGCCAGTTGA ACCGTTGCGG 5020 

GAGATTACCG CAGCCGGTTT GATCAGAGTA CTGGTGACTG CCAGCACCCA CGTTTGTGAC 5080 

TTATAAATAT ACGCCCTGTG GAGC CATAGC C ATTGGC AT A AAGAGAAGAG CACCCCGTGC 514 0 

CACGATGCAG ACACTTCCGG TGTACCCAGC GTCACAGACT GCGTCGCCTA CGAAGCGTGA 5200 

ACTTGCAGCG GCGCCCTCGG TGCCGCAGGA CGGCGCCCGG CTGCCTGCGC AGCTCACTTT 5260 

AGTGACGCCC CCAGAACCTG ATATCCAGAA GAAGTCAGTG CGATCTCAGG TCGCGCGTTT 5320 

AAGCATCTCG GAGACAGATG TAGTGAAGAG TGATATCGTG GCTAAGCTT 5369 

(2) INFORMATION ZU SEQ ID NO: 4: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 475 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

<xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 4: 

Met Asp Arg Gly Cys Lys Gly He Ser Tyr Val Leu Ser Ala Met Val 
15 10 15 

Phe His He He Pro He Thr Phe Glu He Ser Met Val Cys Gly He 
20 25 30 

Leu Thr Tyr Gin Phe Gly Ala Ser Phe Ala Ala He Thr Phe Ser Thr 
35 40 45 

Met Leu Leu Tyr Ser He Phe Thr Phe Arg Thr Thr Ala Trp Arg Thr 
50 55 60 

Arg Phe Arg Arg Asp Ala Asn Lys Ala Asp Asn Lys Ala Ala Ser Val 
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Ala Leu Asp Ser Leu lie Asn Phe Glu Ala Val Lys Tyr Phe Asn Asn 



Glu Lys Tyr Leu Ala Asp Lys Tyr His Thr Ser Leu Met Lys Tyr Arg 
100 105 110 

Asp Ser Gin He Lys Val Ser Gin Ser Leu Ala Phe Leu Asn Thr Gly 
115 120 125 

Gin Asn Leu He Phe Thr Thr Ala Leu Thr Ala Met Met Tyr Met Ala 
130 135 140 

Cys Asn Gly Val Met Gin Gly Ser Leu Thr Val Gly Asp Leu Val Leu 
145 150 155 ISO 

He Asn Gin Leu Val Phe Gin Leu Ser Val Pro Leu Asn Phe Leu Gly 
165 170 175 

Ser Val Tyr Arg Asp Leu Lys Gin Ser Leu He Asp Met Glu Ser Leu 
180 185 190 

Phe Lys Leu Gin Lys Asn Gin Val Thr He Lys Asn Ser Pro Asn Ala 
195 200 205 

Gin Asn Leu Pro He His Lys Pro Leu Asp He Arg Phe Glu Asn Val 
210 215 220 

Thr Phe Gly Tyr Asp Pro Glu Arg Arg He Leu Asn Asn Val Ser Phe 
225 230 235 240 

Thr He Pro Ala Gly Met Lys Thr Ala He Val Gly Pro Ser Gly Ser 
245 250 255 

Gly Lys Ser Thr He Leu Lys Leu Val Phe Arg Phe Tyr Glu Pro Glu 
260 265 270 

Gin Gly Arg He Leu Val Gly GLy Thr Asp He Arg Asp Leu Asp Leu 
275 280 285 

Leu Ser Leu Arg Lys Ala He Gly Val Val Pro Gin Asp Thr Pro Leu 
290 295 300 

Phe Asn Asp Thr He Trp Glu Asn Val Lys Phe Gly Asn He Ser Ser 
305 310 315 320 

Ser Asp Asp Glu He Leu Arg Ala He Glu Lys Ala Gin Leu Thr Lys 
325 330 335 

Leu Leu Gin Asn Leu Pro Lys Gly Ala Ser Thr Val Val Gly Glu Arg 
340 345 350 

Gly Leu Met He Ser Gly Gly Glu Lys Gin Arg Leu Ala He Ala Arg 
355 360 365 
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Val Leu Leu Lys Asp Ala Pro Leu Met Phe Phe Asp Glu Ala Thr Ser 
370 375 380 

Ala Leu Asp Thr His Thr Glu Gin Ala Leu Leu His Thr lie Gin Gin 
385 390 395 400 

Asn Phe Ser Ser Asn Ser Lys Thr Ser Val Tyr Val Ala His Arg Leu 
405 410 415 

Arg Thr lie Ala Asp Ala Asp Lys He lie Val Leu Glu Gin Gly Ser 
420 425 430 

Val Arg Glu Glu Gly Thr His Ser Ser Leu Leu Ala Ser Gin Gly Ser 
435 440 445 

Leu Tyr Arg Gly Leu Trp Asp lie Gin Glu Asn Leu Thr Leu Pro Glu 
450 455 460 

Arg Pro Glu Gin Ser Thr Gly Ser Gin His Ala 
465 470 475 

(2) INFORMATION ZU SEQ ID NO: 5: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 510 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 5: 

Met Cys Gly He Leu Gly Val Val Leu Ala Asp Gin Ser Lys Val Val 
15 10 15 

Ala Pro Glu Leu Phe Asp Gly Ser Leu Phe Leu Gin His Arg Gly Gin 



Asp Ala Ala Gly He Ala Thr Cys Gly Pro Gly Gly Arg Leu Tyr Gin 
35 40 45 

Cys Lys Gly Asn Gly Met Ala Arg Asp Val Phe Thr Gin Ala Arg Met 
50 55 60 

Ser Gly Leu Val Gly Ser Met Gly He Ala His Leu Arg Tyr Pro Thr 
65 70 75 80 

Ala Gly Ser Ser Ala Asn Ser Glu Ala Gin Pro Phe Tyr Val Asn Ser 
85 90 95 

Pro Tyr Gly He Cys Met Ser His Asn Gly Asn Leu Val Asn Thr Met 
100 105 110 
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Ser Leu Arg Arg Tyr Leu Asp Glu Asp Val His Arg His lie Asn Thr 
115 120 125 

Asp Ser Asp Ser Glu Leu Leu Leu Asn lie Phe Ala Ala Glu Leu Glu 
130 135 140 

Lys Tyr Asn Lys Tyr Arg Val Asn Asn Asp Asp He Phe Cys Ala Leu 
145 150 155 160 

Glu Gly Val Tyr Lys Arg Cys Arg Gly Gly Tyr Ala Cys Val Gly Met 
165 170 175 

Leu Ala Gly Tyr Gly Leu Phe Gly Phe Arg Asp Pro Asn Gly He Arg 
180 185 190 

Pro Leu Leu Phe Gly Glu Arg Val Asn Asp Asp Gly Thr Met Asp Tyr 
195 200 205 

Met Leu Ala Ser Glu Ser Val Val Leu Lys Ala His Arg Phe Gin Asn 
210 215 220 

He Arg Asp He Leu Pro Gly Gin Ala Val He He Pro Lys Thr Cys 
225 230 235 240 

Gly Ser Ser Pro Pro Glu Phe Arg Gin Val Val Pro He Glu Ala Tyr 
245 250 255 

Lys Pro Asp Leu Phe Glu Tyr Val Tyr Phe Ala Arg Ala Asp Ser Val 
260 265 270 

Leu Asp Gly He Ser Val Tyr His Thr Arg Leu Leu Met Gly He Lys 
275 280 285 

Leu Ala Glu Asn He Lys Lys Gin He Asp Leu Asp Glu He Asp Val 
290 295 300 

Val Val Ser Val Pro Asp Thr Ala Arg Thr Cys Ala Leu Glu Cys Ala 
305 310 315 320 

Asn His Leu Asn Lys Pro Tyr Arg Glu Gly Phe Val Lys Asn Arg Tyr 
325 330 335 

Val Gly Arg Thr Phe He Met Pro Asn Gin Lys Glu Arg Val Ser Ser 
340 345 350 

Val Arg Arg Lys Leu Asn Pro Met Asn Ser Glu Phe Lys Asp Lys Arg 
355 360 365 

Val Leu He Val Asp Asp Ser He Val Arg Gly Thr Thr Ser Lys Glu 
370 375 380 

He Val Asn Met Ala Lys Glu Ser Gly Ala Ala Lys Val Tyr Phe Ala 
385 390 395 400 
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Ser Ala Ala Pro Ala lie Arg Phe Asn His lie Tyr Gly lie Asp Leu ' 
405 410 415 

Ala Asp Thr Lys Gin Leu Val Ala Tyr Asn Arg Thr Val Glu Glu lie 
420 425 430 

Thr Ala Glu Leu Gly Cys Asp Arg Val lie Tyr Gin Ser Leu Asp Asp 
435 440 445 

Leu lie Asp Cys Cys Lys Thr Asp He lie Ser Glu Phe Glu Val Gly 
450 455 460 

Val Phe Thr Gly Asn Tyr Val Thr Gly Val Glu Asp Val Tyr Leu Gin 
465 470 475 480 

Glu Leu Glu Arg Cys Arg Ala Leu Asn Asn Ser Asn Lys Gly Glu Ala 
485 490 495 

Lys Ala Glu Val Asp He Gly Leu Tyr Asn Ser Ala Asp Tyr 
500 505 510 

(2) INFORMATION ZU SEQ ID NO: 6: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 371 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 6: 

Met Ser Ser Gly Asn He Trp Lys Gin Leu Leu Glu Glu Asn Ser Glu 
15 10 15 

Gin Leu Asp Gin Ser Thr Thr Glu Thr Tyr Val Val Cys Cys Glu Asn 



Glu Asp Ser Leu Asn Gin Phe Leu Gin Gin Cys Trp Gin He Asp Glu 
35 40 45 

Gly Glu Lys Val Thr Asn Leu Glu Pro Leu Gly Phe Phe Thr Lys Val 
50 55 60 

Val Ser Arg Asp Glu Glu Asn Leu Arg Leu Asn Val Tyr Tyr Ala Lys 
65 70 75 80 

Ser Pro Leu Asp Ala Gin Thr Leu Gin Phe Leu Gly Val Phe Leu Arg 
85 90 95 

Gin Met Glu Thr Ser Gin He Arg Trp He Phe Leu Leu Asp Trp Leu 
100 105 110 
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Leu Asp Asp Lys Arg Leu Trp Leu Arg Gin Leu Arg Asn Ser Trp Ala 
115 120 125 

Ala Leu Glu Glu Ala Gin Val Ala Pro Phe Pro Gly Gly Ala Val Val 
130 135 140 

Val Val Leu Asn Pro Ser His Val Thr Gin Leu Glu Arg Asn Thr Met 
145 150 155 160 

Val Trp Asn Ser Arg Arg Leu Asp Leu Val His Gin Thr Leu Arg Ala 
165 170 175 

Ala Cys Leu Asn Thr Gly Ser Ala Leu Val Thr Leu Asp Pro Asn Thr 
180 185 190 

Ala Arg Glu Asp Val Met His lie Cys Ala Leu Leu Ala Gly Leu Pro 
195 200 205 

Thr Ser Arg Pro Val Ala Met Leu Ser Leu Gin Ser Leu Phe lie Pro 
210 215 220 

His Gly Ala Asp Ser lie Gly Lys lie Cys Thr lie Ala Pro Glu Phe 
225 230 235 240 

Pro Val Ala Thr Val Phe Asp Asn Asp Phe Val Ser Ser Thr Phe Glu 
245 250 255 

Ala Ala lie Ala Pro Glu Leu Thr Pro Gly Pro Arg Val Pro Ser Asp 
260 265 270 

His Pro Trp Leu Thr Glu Pro Thr Asn Pro Pro Ser Glu Ala Thr Ala 
275 280 285 

Trp His Phe Asp Leu Gin Gly Arg Leu Ala Thr Leu Tyr Arg His Leu 
290 295 300 

Gly Asp Ser Asn Lys Ala lie Ser Val Thr Gin His Arg Phe His Lys 
305 310 315 320 

Pro Arg Ser Glu Asp Tyr Ala Tyr Glu Phe Glu Leu Pro Ser Lys His 
325 330 335 

Pro Thr lie Arg Asp Leu He Arg Ser Ala Ala Ala Asp Ser Pro Asn 
340 345 350 

Asp Val Ala Asp Ser He Asp Gly Leu Met Asp Gly He Val Gin Arg 
355 360 365 

Asn Val His 
370 

(2) INFORMATION ZU SEQ ID NO: 7: 
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(i) SEQUENZ CHARAKTERI STIKA : 

(A) LANGE: 3616 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

<ii) ART DES MOLEKULS: DNS (genomisch) 
(iii) HYPOTHETISCH: NEIN 
(iii) ANTISENSE: NEIN 

(ix) 



(A) NAME/SCHLUSSEL: 5'UTR 

(B) LAGE: 1..863 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 864.. 1316 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: intron 

(B) LAGE: 1317. .1477 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 1478.. 2592 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: 3'UTR 

(B) LAGE: 2593.. 3616 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 7: 

GGGCCCGGTG CCAGCTCGCC AGGTGCGGAC TCGCGCTCGG GCTGTGGGCG CTCTACCTGC 60 

TGCTGCTCGG CAGCTGCCTG ACGCGCGCGT ACGAGCTGTC GGATCTCGAA AACCTGGAAT 120 

CCGATTACTA CAGCTACGTG CTGGATGTGA ACTTCGCGCT GCTGAGCGCC ATGAGCGCGA 180 

CCGGCCTCGC GATGGGCGCC GTGAGCGGCT CCCTCGGGAG CGCGCCGGTG CTCGCGCAGT 240 

GGCCGGCAGC GATCTGGGCC GTGCGCTTCC TGCGCGCCGC GGGCTATGTC GCGATAGTCC 300 

TAATCCTGCC GTTCCTGTCC GTCGTCGCAT TCCTGCAGCC GCTCTGCGAG CGCGCGCTGG 360 

CGCTGTTCCC GTTTGTGCGC GCGTGGGGCA TGGACGGCGT GTTCAACTTC CTGCTGCTCT 420 

CCGCCGTGCT CTGG AC TGT A TTCCTGGCCG TTCGCCTGCT CCGCGCCGTC TACAGACTGC 480 

TGCGCTGGCT GGTCGGTCTT TTGGTCCGCC TGGCACGCCT GCTGCTGCGA GGCGCCCGTC 540 

GGACGCCTGC GGCGGCCCCC GAGGAGCCCG TCTAGCGTGC GCGCGTTCTA GGCCCCTGAC 600 

AGCTCCTACC TGGTGCTGGC CGCCGGTAGG GCTCGCATCG TGCGGCGCAG GCCCATTGCT 660 
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TTTTGGCCCC CGCTGGATCA TCGTTTCTTT TACGTGAAAA GTTTGCAGCG ATGAGCTGCA 720 

GTATAAATAG GTTTTCTAGA TGCGCCAAAT CCCAGCTGGG TTTACCGGCG TCTGTTCGGG 780 

ATAGTTACTT GATGGATGGG TCAACTTGAG AGC TTGGGTT TAGTGTTGAC TCCTTCTCTT 840 

CATAGCACGC CGAACAAAGC GCA ATG ACT TAC AGA GAC GCA GCC ACG GCA 890 
Met Thr Tyr Arg Asp Ala Ala Thr Ala 



CTG GAG CAC CTG GCG ACG TAC GCC GAG AAG GAC GGG CTG TCC GTG GAG 
Leu Glu His Leu Ala Thr Tyr Ala Glu Lys Asp Gly Leu Ser Val Glu 



CAG TTG ATG GAC TCC AAG ACG CGG GGC GGG TTG ACG TAC AAC GAC TTC 9 86 

Gin Leu Met Asp Ser Lys Thr Arg Gly Gly Leu Thr Tyr Asn Asp Phe 
30 35 40 

CTG GTC TTG CCG GGC AAG ATC GAC TTC CCA TCG TCG GAG GTG GTG CTG 1034 
Leu Val Leu Pro Gly Lys lie Asp Phe Pro Ser Ser Glu val Val Leu 
45 50 55 

TCG TCG CGC CTG ACC AAG AAG ATC ACC TTG AAC GCG CCG TTT GTG TCG 1082 
Ser Ser Arg Leu Thr Lys Lys lie Thr Leu Asn Ala Pro Phe Val Ser 
60 65 70 

TCG CCG ATG GAC ACG GTG ACG GAG GCC GAC ATG GCG ATC CAC ATG GCG 1130 
Ser Pro Met Asp Thr Val Thr Glu Ala Asp Met Ala He His Met Ala 
75 80 85 

CTC CTG GGC GGC ATC GGG ATC ATC CAC CAC AAC TGC ACT GCG GAG GAG 1178 
Leu Leu Gly Gly He Gly He He His His Asn Cys Thr Ala Glu Glu 
90 95 100 105 

CAG GCG GAG ATG GTG CGC CGG GTC AAG AAG TAC GAA AAC GGG TTC ATC 1226 
Gin Ala Glu Met Val Arg Arg Val Lys Lys Tyr Glu Asn Gly Phe He 
110 115 120 

AAC GCC CCC GTG GTC GTG GGG CCG GAC GCG ACG GTG GCG GAC GTG CGC 1274 
Asn Ala Pro Val Val Val Gly Pro Asp Ala Thr Val Ala Asp Val Arg 
125 130 135 

CGG ATG AAG AAC GAG TTT GGG TTT GCA GGA TTT CCT GTG ACA 1316 
Arg Met Lys Asn Glu Phe Gly Phe Ala Gly Phe Pro Val Thr 
140 145 150 

GGTATGTTAG AGTGGCACGC GGGGCTGCAC GCTGGGATGA TGATCATAAA TCAATAACTT 13 76 

TCGTTCTACT GACTGCGATC AAACGATCGT GTAGACACCT TTTACTCTGA CCGCAGACGT 1436 

GCAGCGCCTT TTTGGCAGGA AC ATGT AC T A ACACATCAGC A GAT GAT GGC AAG 1489 

Asp Asp Gly Lys 
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CCG ACC GGG AAG CTG CAG GGG ATC ATC ACG TCC CGT GAC ATC CAG TTT 
Pro Thr Gly Lys Leu Gin Gly lie lie Thr Ser Arg Asp lie Gin Phe 
5 10 15 20 

GTC GAG GAC GAG ACC CTG CTT GTG TCT GAG ATC ATG ACC AAG GAC GTC 
Val Glu Asp Glu Thr Leu Leu Val Ser Glu He Met Thr Lys Asp Val 
25 30 35 

ATC ACT GGG AAG CAG GGC ATC AAC CTC GAG GAG GCG AAC CAG ATC CTG 
lie Thr Gly Lys Gin Gly He Asn Leu Glu Glu Ala Asn Gin He Leu 



AAG AAC ACC AAG AAG GGC AAG CTG CCA ATT GTG GAC GAG GCG GGC TGC 
Lys Asn Thr Lys Lys Gly Lys Leu Pro He Val Asp Glu Ala Gly Cys 
55 60 65 

CTG GTG TCC ATG CTT TCG AGA ACT GAC TTG ATG AAG AAC CAG TCC TAC 
Leu Val Ser Met Leu Ser Arg Thr Asp Leu Met Lys Asn Gin Ser Tyr 
70 75 80 

CCA TTG GCC TCC AAG TCT GCC GAC ACC AAG CAG CTG CTC TGT GGT GCT 
Pro Leu Ala Ser Lys Ser Ala Asp Thr Lys Gin Leu Leu Cys Gly Ala 
85 90 95 100 

GCG ATC GGC ACC ATC GAC GCG GAC AGG CAG AGA CTG GCG ATG CTG GTC 
Ala He Gly Thr He Asp Ala Asp Arg Gin Arg Leu Ala Met Leu Val 
105 110 115 

GAG GCC GGT CTG GAC GTT GTT GTG CTA GAC TCC TCG CAG GGT AAC TCG 
Glu Ala Gly Leu Asp Val Val Val Leu Asp Ser Ser Gin Gly Asn Ser 
120 125 130 

GTC TTC CAG ATC AAC ATG ATC AAG TGG ATC AAG GAG ACC TTC CCA GAC 
Val Phe Gin He Asn Met He Lys Trp He Lys Glu Thr Phe Pro Asp 
135 140 145 

CTG CAG GTC ATT GCT GGC AAC GTG GTC ACC AGA GAG CAG GCT GCC AGC 
Leu Gin Val He Ala Gly Asn Val Val Thr Arg Glu Gin Ala Ala Ser 
150 155 160 

TTG ATC CAC GCC GGC GCA GAC GGG TTG CGT ATC GGT ATG GGC TCT GGC 
Leu He His Ala Gly Ala Asp Gly Leu Arg He Gly Met Gly Ser Gly 
165 170 175 180 

TCC ATC TGT ATC ACT CAG GAG GTG ATG GCC TGT GGT AGA CCA CAG GGT 
Ser He Cys He Thr Gin Glu Val Met Ala Cys Gly Arg Pro Gin Gly 
185 190 195 

ACC GCT GTC TAC AAC GTC ACG CAG TTC GCC AAC CAG TTT GGT GTG CCA 
Thr Ala Val Tyr Asn Val Thr Gin Phe Ala Asn Gin Phe Gly Val Pro 
200 205 210 
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TGT ATT GCT GAC GGT GGT GTC CAG AAC ATC GGG CAC ATT ACC AAA GCT 2161 
Cys He Ala Asp Gly Gly Val Gin Asn He Gly His He Thr Lys Ala 
215 220 225 

ATC GCT CTT GGC GCG TCC ACC GTC ATG ATG GGC GGT ATG CTG GCA GGC 2209 
He Ala Leu Gly Ala Ser Thr Val Met Met Gly Gly Met Leu Ala Gly 
230 235 240 

ACT AC A GAG TCT CCA GGC GAG TAC TTC TTC AGG GAC GGG AAG AGA CTG 2257 
Thr Thr Glu Ser Pro Gly Glu Tyr Phe Phe Arg Asp Gly Lys Arg Leu 
245 250 255 260 

AAG ACC TAC AGA GGT ATG GGC TCC ATC GAC GCC ATG CAA AAG ACT GAT 2 305 

Lys Thr Tyr Arg Gly Met Gly Ser He Asp Ala Met Gin Lys Thr Asp 
265 270 275 

GTC AAG GGT AAC GCC GCT ACC TCC CGT TAC TTC TCT GAG TCT GAC AAG 2353 
Val Lys Gly Asn Ala Ala Thr Ser Arg Tyr Phe Ser Glu Ser Asp Lys 
280 285 290 

GTT CTG GTC GCT CAG GGT GTT ACT GGT TCT GTG ATC GAC AAG GGC TCC 2401 
Val Leu Val Ala Gin Gly Val Thr Gly Ser Val He Asp Lys Gly Ser 
295 300 305 

ATC AAG AAG TAC ATT CCA TAT CTG TAC AAT GGT CTA CAG CAC TCG TGC 2449 
He Lys Lys Tyr He Pro Tyr Leu Tyr Asn Gly Leu Gin His Ser Cys 
310 315 320 

CAG GAT ATC GGT GTG CGC TCT CTA GTG GAG TTC AGA GAG AAG GTG GAC 2497 
Gin Asp lie Gly Val Arg Ser Leu Val Glu Phe Arg Glu Lya Val Asp 
325 330 335 340 

TCT GGC TCG GTC AGA TTT GAG TTC AGA ACT CCA TCT GCC CAG TTG GAG 2 545 

Ser Gly Ser Val Arg Phe Glu Phe Arg Thr Pro Ser Ala Gin Leu Glu 
345 350 355 

GGT GGT GTG CAC AAC TTG CAC TCC TAC GAG AAG CGC CTA TTT GACTGAGTGC 2597 
Gly Gly Val His Asn Leu His Ser Tyr Glu Lys Arg Leu Phe Asp 
360 365 370 

CACTAGGCCC ACACTATAGA AGTGGATCCG GGCGCGATGG CACCCATACT TTTATATTAT 2657 

GTTGATTGAT GTACGTAAAC GATAGATATA ATAACAGACG CGGCATCTCA TTTGTATGCA 2717 

ATATATCTGG AACATGGTTA TGCGTACTCA ACTGTATGTA CTACTTTATA TACACAGCTC 2777 

TGGGACACTT GGTGAGATAT ATGTTTCATT ATGTATGCCT CGCTATCGAA AGGTCTGGCA 2837 

TTATGGGCTA CTGGGTCTAA GAGTCATGGC TTATGAGTAT TTATTTATTT ATTTC TCTTC 289 7 

CTTTTCATTA AACTCCTCGA GCTTCTTTCT GTAATACTGC TCTCTAGACT TCTCCACATC 2957 

TGCTAATGAT GGTGGAAGTC GTTCGTTTTC CAAATCCGCT CTACGAGCGC GCTCGAAGTT 3017 
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AGACAGCGCC 


TCGTTCAGAC 


CTTCAGACCC 


GCGTGACAGC 


GCTCCACGAG GCAGCACGCC 


3077 


AGAATTCATT 


GTTTTTAGGT 


ACTGCACCTT 


ATCGCTCTCT 


TCTCTCAACA CGCTATACAT 


3137 


TCGGGAAACC 


TTGGCAATCG 


CCAATATTTT 


ACTGCGTAGT 


GCACGCCGTT TTGCATCATC 


3197 


GTCCAGAATA 


GACCGTTTTT 


TCTTCGATTT 


CTTGGAGCCA 


GGTATAACAG TTACAACCTG 


3257 


CTCAGTGTTT 


TTGGACTTCA 


ATGTAGCACC 


TAAGTCCTCC 


CTTATAACAA AAGTCTCTTC 


3317 


CTCCAATTCT 


TCTTCAGTAC 


AAATGTTTAA 


TATCGAAACC 


AACATTTCAG TCACTTTCTC 


3377 


GCCAACAAAT 


GGCAAAGACC 


AGGTGAATAC 


GTCCATGAAA 


TTCGGTAACC AATACGGATG 


3437 


CTGTGACATG 


TTAAATTGTC 


TAATGTTCAT 


AACGTTATCC 


GAGTATTTTA GGACCGCGGC 


3497 


CTTGTTCTTG 


TAAGTGTCCA AGTAGTTGGG 


TGCGCTGAAC 


AACGTAAG.TA AACTAGGAAA 


3557 


GCCCAGATTC 


TTGGTATTCT 


TGTACATTCT 


GTAGCCCTGA 


TCTTGGGCTT CGTGGGCCC 


3616 


(2) INFORMATION ZU SEC 


3 ID NO: 8: 









(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE : 151 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 8: 

Met Thr Tyr Arg Asp Ala Ala Thr Ala Leu Glu His Leu Ala Thr Tyr 
15 10 15 

Ala Glu Lys Asp Gly Leu Ser Val Glu Gin Leu Met Asp Ser Lys Thr 
20 25 30 

Arg Gly Gly Leu Thr Tyr Asn Asp Phe Leu val Leu Pro Gly Lys lie 



Asp Phe Pro Ser Ser Glu Val Val Leu Ser Ser Arg Leu Thr Lys Lys 
50 55 60 

lie Thr Leu Asn Ala Pro Phe Val Ser Ser Pro Met Asp Thr Val Thr 
65 70 75 80 

Glu Ala Asp Met Ala He His Met Ala Leu Leu Gly Gly He Gly He 



He His His Asn Cys Thr Ala Glu Glu Gin Ala Glu Met Val Arg Arg 
100 105 110 

Val Lys Lys Tyr Glu Asn Gly Phe He Asn Ala Pro Val Val Val Gly 
115 120 125 
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Pro Asp Ala Thr Val Ala Asp Val Arg Arg Met Lys Asn Glu Phe Gly 



Phe Ala Gly Phe Pro val Thr 
145 150 

(2) INFORMATION ZU SEQ ID NO: 9: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 371 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 9: 

Asp Asp Gly Lys Pro Thr Gly Lys Leu Gin Gly He He Thr Ser Arg 
15 10 15 

Asp lie Gin Phe Val Glu Asp Glu Thr Leu Leu Val Ser Glu He Met 
20 25 30 

Thr Lys Asp Val He Thr Gly Lys Gin Gly He Asn Leu Glu Glu Ala 
35 40 45 

Asn Gin He Leu Lys Asn Thr Lys Lys Gly Lys Leu Pro He Val Asp 
50 55 60 

Glu Ala Gly Cys Leu Val Ser Met Leu Ser Arg Thr Asp Leu Met Lys 
65 70 75 80 

Asn Gin Ser Tyr Pro Leu Ala Ser Lys Ser Ala Asp Thr Lys Gin Leu 
85 90 95 

Leu Cys Gly Ala Ala He Gly Thr He Asp Ala Asp Arg Gin Arg Leu 
100 105 HO 

Ala Met Leu Val Glu Ala Gly Leu Asp Val Val Val Leu Asp Ser Ser 
115 120 125 

Gin Gly Asn Ser Val Phe Gin He Asn Met He Lys Trp He Lys Glu 
130 135 140 

Thr Phe Pro Asp Leu Gin Val He Ala Gly Asn Val Val Thr Arg Glu 
145 150 155 160 

Gin Ala Ala Ser Leu He His Ala Gly Ala Asp Gly Leu Arg He Gly 
165 170 175 

Met Gly Ser Gly Ser He Cys He Thr Gin Glu Val Met Ala Cys Gly 
180 185 190 
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Arg Pro Gin Gly Thr Ala Val Tyr Asn Val Thr Gin Phe Ala Asn Gin 
195 200 205 

Phe Gly Val Pro Cys lie Ala Asp Gly Gly Val Gin Asn lie Gly His 
210 215 220 

lie Thr Lys Ala He Ala Leu Gly Ala Ser Thr Val Met Met Gly Gly 
225 230 235 240 

Met Leu Ala Gly Thr Thr Glu Ser Pro Gly Glu Tyr Phe Phe Arg Asp 
245 250 255 

Gly Lys Arg Leu Lys Thr Tyr Arg Gly Met Gly Ser lie Asp Ala Met 
260 265 270 

Gin Lys Thr Asp Val Lys Gly Asn Ala Ala Thr Ser Arg Tyr Phe Ser 
275 280 285 

Glu Ser Asp Lys Val Leu Val Ala Gin Gly Val Thr Gly Ser Val He 
290 295 300 

Asp Lys Gly Ser He Lys Lys Tyr He Pro Tyr Leu Tyr Asn Gly Leu 
305 310 315 320 

Gin His Ser Cys Gin Asp He Gly Val Arg Ser Leu Val Glu Phe Arg 
325 330 335 

Glu Lys Val Asp Ser Gly Ser Val Arg Phe Glu Phe Arg Thr Pro Ser 
340 345 350 

Ala Gin Leu Glu Gly Gly Val His Asn Leu His Ser Tyr Glu Lys Arg 
355 360 365 

Leu Phe Asp 
370 

(2) INFORMATION ZU SEQ ID NO: 10: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 2697 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM : Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKtJLS: DNS (genomisch) 
(iii) HYPOTHETISCH: NEIN 
(iii) ANTISENSE: NEIN 

(ix) MERKMALE: 

(A) NAME / SCHLUS SEL : 5'UTR 

(B) LAGE: 1..455 
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(ix) MERKMALE: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE: 456. .2033 

(ix) MERKMALE: 

(A) NAME/ SCHLUSSEL: 3'UTR 

(B) LAGE: 2034.. 2697 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 10: 

ATCGATTTCA GGAGATTTTT GGTAGCATTA TTGAGGTCAT TAGAGGCGTT CTGTGACTTT 60 

CGACGATTTG CACGCGCAGA AGAGGGCGTT CAACCAGCCT TTCGGATATT CCGGTTCGAG 120 

TTATACCAGC AGGGATCAGC GCAGGCACTA GAGTGGCGGG TGCTAATAAG AGGAGCAGGT 180 

CCTGGAACTG AAGTTGCAAG AGATAAGCAT TGCGCGGAGA AGGAGGCGGT TAGAGGGTGC 240 

AAGCGAGCAG GATGGGGTCT TCGATGAACT TCCCGTCTGG GTATGTGAAC AAGCACACGC 300 

TGCAGGCACA CCGGTAGGGC GAGTGCAGGG TGAAAAATAT ATATGCGCTC GAGAAGCGCT 360 

GGGGATGAGT TCGTCTGCAA CGGCAGGCGG ATCTTCATCT GACAAAACCA GCTGCCTACA 420 

TCAGTGCGAA GCTGTTCAGT GATAGAATAG GAGTA ATG GCT GCT GTT GAA CAA 473 

Met Ala Ala Val Glu Gin 



GTT TCT AGC GTG TTT GAC ACC ATT TTG GTG CTG GAC TTC GGG TCC CAG 
Val Ser Ser Val Phe Asp Thr He Leu Val Leu Asp Phe Gly Ser Gin 
10 15 20 

TAC TCG CAT CTG ATC ACG CGG CGG CTG CGT GAG TTT AAT GTG TAC GCG 
Tyr Ser His Leu He Thr Arg Arg Leu Arg Glu Phe Asn Val Tyr Ala 



GAG ATG CTT CCG TGT ACG CAG AAG ATC AGC GAG CTG GGC TGG AAG CCA 
Glu Met Leu Pro Cys Thr Gin Lys He Ser Glu Leu Gly Trp Lys Pro 
40 45 50 

AAG GGT GTG ATT TTG TCA GGC GGG CCG TAC TCC GTG TAC GCG GCA GAT 
Lys Gly Val He Leu Ser Gly Gly Pro Tyr Ser Val Tyr Ala Ala Asp 
55 60 65 70 

GCT CCG CAC GTG GAC CGG GCG GTG TTC GAG TTG GGC GTT CCA ATT CTG 
Ala Pro His Val Asp Arg Ala Val Phe Glu Leu Gly Val Pro He Leu 
75 80 85 

GGC ATC TGC TAC GGG CTA CAG GAG CTT GCG TGG ATA GCC GGC GCA GAG 
Gly He Cys Tyr Gly Leu Gin Glu Leu Ala Trp He Ala Gly Ala Glu 
90 95 100 
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GTG GGG CGC GGC GAG AAG CGC GAG TAC GGG CGC GCG ACG CTG CAC GTG 
Val Gly Arg Gly Glu Lys Arg Glu Tyr Gly Arg Ala Thr Leu His Val 
105 110 115 

GAG GAC AGC GCG TGC CCG CTG TTC AAC AAC GTG GAC AGC AGC ACG GTG 
Glu Asp Ser Ala Cys Pro Leu Phe Asn Asn Val Asp Ser Ser Thr Val 
120 125 130 

TGG ATG TCG CAC GGT GAC AAG CTG CAC GCA CTA CCT GCG GAT TTC CAC 
Trp Met Ser His Gly Asp Lys Leu His Ala Leu Pro Ala Asp Phe His 
135 140 145 150 

GTC ACT GCG ACG ACG GAG AAC TCT CCT TTC TGC GGG ATT GCA CAC GAC 
Val Thr Ala Thr Thr Glu Asn Ser Pro Phe Cys Gly lie Ala His Asp 
155 160 165 

TCG AAG CCA ATC TTC GGG ATC CAG TTC CAC CCT GAG GTG ACG CAC TCC 
Ser Lys Pro He Phe Gly He Gin Phe His Pro Glu Val Thr His Ser 
170 175 180 

TCG CAG GGG AAG ACG TTG CTG AAG AAC TTT GCG GTG GAG ATC TGC CAG 
Ser Gin. Gly Lys Thr Leu Leu Lys Asn Phe Ala Val Glu He Cys Gin 
185 190 195 

GCC GCG CAG ACC TGG ACG ATG GAA AAC TTC ATT GAC ACC GAG ATC CAG 
Ala Ala Gin Thr Trp Thr Met Glu Asn Phe He Asp Thr Glu He Gin 
200 205 210 

CGG ATC CGG ACC CTT GTG GGC CCC ACC GCG GAA GTC ATC GGT GCT GTG 
Arg lie Arg Thr Leu Val Gly Pro Thr Ala Glu Val He Gly Ala Val 
215 220 225 230 

TCC GGC GGT GTC GAC TCG ACC GTC GCT GCG AAG CTG ATG ACC GAG GCC 
Ser Gly Gly Val Asp Ser Thr Val Ala Ala Lys Leu Met Thr Glu Ala 
235 240 245 

ATC GGC GAC CGG TTC CAC GCG ATC CTG GTC GAC AAC GGT GTT CTG CGC 
He Gly Asp Arg Phe His Ala lie Leu Val Asp Asn Gly Val Leu Arg 
250 255 260 

CTC AAC GAA GCG GCC AAT GTG AAG AAA ATC CTC GGC GAG GGC TTG GGC 
Leu Asn Glu Ala Ala Asn Val Lys Lys He Leu Gly Glu Gly Leu Gly 
265 270 275 

ATC AAC TTG ACT GTT GTT GAC GCC TCC GAA GAG TTC TTG ACG AAG CTC 
He Asn Leu Thr Val Val Asp Ala Ser Glu Glu Phe Leu Thr Lys Leu 
280 285 290 

AAG GGC GTC ACG GAC CCT GAG AAG AAG AGA AAG ATC ATC GGT AAC ACC 
Lys Gly Val Thr Asp Pro Glu Lys Lys Arg Lys He He Gly Asn Thr 
295 300 305 310 
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75 



20 



25 



30 



35 



40 



TTC 
Phe 


ATT 
lie 


CAT 
His 


GTT 
Val 


TTT 

Phe 

315 


GAG 
Glu 


CGC 
Arg 


GAG 
Glu 


GCA 
Ala 


GCC AGG ATC 
Ala Arg He 
320 


CAG 
Gin 


CCT 
Pro 


AAG 
Lys 


AAC 
Asn 


1433 


GGC 
Gly 


GAG 
Glu 


GAG 
Glu 


ATT 
He 
330 


GAG 
Glu 


TTC 
Phe 


CTG 
Leu 


TTG 
Leu 


CAG 
Gin 
335 


GGT ACC CTA 
Gly Thr Leu 


TAC 
Tyr 


CCT 
Pro 


GAC 
Asp 


GTT 
Val 


1481 


ATC 
lie 


GAG 
Glu 


TCC 
Ser 


ATT 
He 


TCC 
Ser 


TTT 
Phe 


AAG 

Lys 


GGC 
Gly 


CCA 
Pro 


TCT 
Ser 


CAG 
Gin 


ACG 
Thr 


ATC 
He 


AAG 

Lys 


ACC 
Thr 


CAC 
His 


1529 


CAT 
His 


AAC 
Asn 
360 


GTC 
Val 


GGT 
Gly 


GGT 
Gly 


CTT 
Leu 


TTG 

Leu 
365 


GAC 
Asp 


AAC 
Asn 


ATG 
Met 


AAA 
Lys 


CTG 
Leu 
370 


AAG 
Lys 


CTC 
Leu 


ATT 
He 


GAG 
Glu 


1577 


CCT 
Pro 
375 


TTG 
Leu 


CGC 
Arg 


GAG 
Glu 


CTT 
Leu 


TTC 
Phe 
380 


AAG 
Lys 


GAC 
Asp 


GAG 
Glu 


GTG 
Val 


AGA 
Arg 
385 


CAC 
His 


CTG 
Leu 


GGA 
Gly 


GAA 
Glu 


CTA 
Leu 
390 


1625 


TTG 
Leu 


GGG 
Gly 


ATC 
He 


TCC 
Ser 


CAC 
His 
395 


GAG 
Glu 


TTG 
Leu 


GTC 
Val 


TGG 
Trp 


AGA 
Arg 
400 


CAT 
His 


CCG 
Pro 


TTC 
Phe 


CCA 
Pro 


GGC 
Gly 
405 


CCA 
Pro 


1673 


GGT 
Gly 


ATC 
lie 


GCC 
Ala 


ATC 
lie 
410 


CGT 
Arg 


GTG 
Val 


CTA 
Leu 


GGC 
Gly 


GAG 
Glu 
415 


GTC 
Val 


ACC 
Thr 


AAG 
Lys 


GAG 
Glu 


CAG 
Gin 
420 


GTG 
Val 


GAG 
Glu 


1721 


ATT 
lie 


GCC 
Ala 


AGA 
Arg 
425 


AAG 
Lys 


GCA 
Ala 


GAC 
Asp 


CAC 
His 


ATC 
He 

430 


TAC 
Tyr 


ATC 
He 


GAG 
Glu 


GAG 
Glu 


ATC 
He 
435 


AGG 
Arg 


AAA 
Lys 


GCA 
Ala 


1769 


GGT 
Gly 


CTA TAC 
Leu Tyr 
440 


AAC 
Asn 


AAG 
Lys 


ATT 
He 


TCT 
Ser 


CAA 
Gin 


GCT 
Ala 


TTT GCT 
Phe Ala 


TGC 
Cys 
450 


TTG 
Leu 


CTG 
Leu 


CCT 
Pro 


GTT 
Val 


1817 


AAG 
Lys 


TCT 
Ser 


GTG 
Val 


GGT 
Gly 


GTC 
Val 


ATG 
Met 


GGT 
Gly 


GAC 
Asp 


CAG 
Gin 


AGA 
Arg 


ACC 
Thr 
465 


TAC 
Tyr 


GAC 


CAG 
Gin 


GTC 
Val 


ATT 
He 


1865 


GCT 
Ala 


CTA 
Leu 


AGA 
Arg 


GCA 
Ala 


ATT 
He 
475 


GAG 
Glu 


ACC 
Thr 


ACG 
Thr 


GAC 
Asp 


TTC ATG 
Phe Met 
480 


ACT 
Thr 


GCC 
Ala 


GAC 
Asp 


TGG 
Trp 
485 


TAT 
Tyr 


1913 


CCA 
Pro 


TTT 
Phe 


GAG 
Glu 


CAC 
His 
490 


GAA 
Glu 


TTC 
Phe 


TTG 
Leu 


AAG 
Lys 


CAT 
His 
495 


GTC 
Val 


GCA 
Ala 


TCC 
Ser 


CGT 
Arg 


ATT 
He 
500 


GTT 
Val 


AAC 
Asn 


1961 


GAG 
Glu 


GTT 
Val 


GAA 
Glu 
505 


GGT 
Gly 


GTT 
Val 


GCC 
Ala 


AGA 
Arg 


GTC 
Val 
510 


ACC 
Thr 


TAC GAC 
Tyr Asp 


ATA 
He 


ACT 
Thr 
515 


TCT 
Ser 


AAG 
Lys 


CCT 
Pro 


2009 



55 



37 
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CCA GCT ACC GTT GAA TGG GAA TAATCACCCT TGGGATCCGC TGACTGGCTA 2060 
Pro Ala Thr Val Glu Trp Glu 
520 525 

CTGTAATTCT ATGTAGTGGA TTAGTACGAT AAGTTACTTT TGTATGATAG ATGTAATCAC 2120 

ATCTGGCTAT TAAAATGACT CAGCCGAGGT AAATCTAACG TCCCTTCACA AGGGTGTTCC 2180 

TGTGTGGACT TCCGCCTGAA TTTTTATAGA TATATAGATA CTCTACTCAT GAACAACCTG 2240 

CAACCGAATA AGCATTAGTG CCAGGAGAAG AGAACCGTGG AAATGGGGCA AGTAGAAAAA 2300 

ATCATATTCC TTAAGAATAA GACAGTACCA GAGGACCATT ACGAGACGAT TTTTGAATCG 2360 

AATGGCTTCC AGACTCACTT TGTACCCATA ATAACCCATG AACACCTGCC AGATGAGGTT 2420 

CGCGGTCGAC TATCCGACGC GAATTACATG AAAAGGTTGA ATTGTTTGGT GGTAACCTCT 2480 

CAGAGGACTG TGGAGTGTCT CTATGAGGAC GTTCTGCCCT CTCTTCCAGC TGAAGCACGC 2540 

AAATCTCTTC TCAATACGCC AGTATTCGTG GTTGGGCGTG CCACTCAGGA ATTTATGGAG 2600 

AGATGCGGCT TTACGGACGT GAGAGGGGGA TCTGAGACTG GTAATGGCGT TTTGCTAGCG 2660 

GAGTTAATGT TAAATATGAT CC AG AAGGGC GATGGGG 2 697 

(2) INFORMATION ZU SEQ ID NO: 11: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 525 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 11: 

Met Ala Ala Val Glu Gin Val Ser Ser Val Phe Asp Thr lie Leu Val 
15 10 15 

Leu Asp Phe Gly Ser Gin Tyr Ser His Leu lie Thr Arg Arg Leu Arg 
20 25 30 

Glu Phe Asn Val Tyr Ala Glu Met Leu Pro Cys Thr Gin Lys lie Ser 
35 40 45 

Glu Leu Gly Trp Lys Pro Lys Gly Val lie Leu Ser Gly Gly Pro Tyr 
50 55 60 

Ser Val Tyr Ala Ala Asp Ala Pro His Val Asp Arg Ala Val Phe Glu 
65 70 75 80 

Leu Gly Val Pro lie Leu Gly lie Cys Tyr Gly Leu Gin Glu Leu Ala 
85 90 95 



BNSDOCID: <EP 0927761 A2_l_> 



EP 0 927 761 A2 



Trp lie Ala Gly Ala Glu Val Gly Arg Gly Glu Lys Arg Glu Tyr Gly 
100 105 110 

Arg Ala Thr Leu His Val Glu Asp Ser Ala Cys Pro Leu Phe Asn Asn 
115 120 125 

Val Asp Ser Ser Thr Val Trp Met Ser His Gly Asp Lys Leu His Ala 
130 135 140 

Leu Pro Ala Asp Phe His Val Thr Ala Thr Thr Glu Asn Ser Pro Phe 
145 150 155 160 

Cys Gly He Ala His Asp Ser Lys Pro He Phe Gly He Gin Phe His 
165 170 175 

Pro Glu Val Thr His Ser Ser Gin Gly Lys Thr Leu Leu Lys Asn Phe 
180 185 190 

Ala val Glu He Cys Gin Ala Ala Gin Thr Trp Thr Met Glu Asn Phe 
195 200 205 

He Asp Thr Glu He Gin Arg He Arg Thr Leu Val Gly Pro Thr Ala 
210 215 220 

Glu Val He Gly Ala Val Ser Gly Gly Val Asp Ser Thr Val Ala Ala 
225 230 235 240 

Lys Leu Met Thr Glu Ala He Gly Asp Arg Phe His Ala He Leu Val 
245 250 255 

Asp Asn Gly val Leu Arg Leu Asn Glu Ala Ala Asn Val Lys Lys He 
260 265 270 

Leu Gly Glu Gly Leu Gly He Asn Leu Thr Val Val Asp Ala Ser Glu 
275 280 285 

Glu Phe Leu Thr Lys Leu Lys Gly Val Thr Asp Pro Glu Lys Lys Arg 
290 295 300 

Lys He He Gly Asn Thr Phe He His Val Phe Glu Arg Glu Ala Ala 
305 310 315 320 

Arg He Gin Pro Lys Asn Gly Glu Glu He Glu Phe Leu Leu Gin Gly 
325 330 335 

Thr Leu Tyr Pro Asp Val He Glu Ser He Ser Phe Lys Gly Pro Ser 
340 345 350 

Gin Thr He Lys Thr His His Asn Val Gly Gly Leu Leu Asp Asn Met 
355 360 355 

Lys Leu Lys Leu He Glu Pro Leu Arg Glu Leu Phe Lys Asp Glu Val 
370 375 380 
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Trp Arg 
400 

Glu Val 
415 

Tyr He 



Ala Phe 



Gin Arg 



Asp Phe 
480 

His Val 
495 

Thr Tyr 



(2) INFORMATION ZU SEQ ID NO: 12: 

(i) SEQUENZ CHARAKTERISTIKA : 

(A) LANGE: 1634 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: cDNS zu mRNS 
iiii) HYPOTHETISCH: NEIN 
(iii) ANTI SENSE: NEIN 

(ix) MERKMALE: 

(A) NAME/ SCHLUSSEL: 5'UTR 

(B) LAGE: 1..519 

(ix) MERKMALE: 

(A) NAME /SCHLUSSEL: CDS 

(B) LAGE: 520.. 1482 

(ix) MERKMALE : 

(A) NAME/SCHLUSSEL: 3'UTR 

(B) LAGE: 1483.. 1634 

(Xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 12: 



Arg His Leu Gly Glu Leu Leu Gly He Ser His Glu Leu Val 
385 390 395 

His Pro Phe Pro Gly Pro Gly He Ala He Arg Val Leu Gly 
405 410 

Thr Lys Glu Gin Val Glu He Ala Arg Lys Ala Asp His He 
420 425 430 

Glu Glu He Arg Lys Ala Gly Leu Tyr Asn Lys He Ser Gin 
435 440 445 

Ala Cys Leu Leu Pro Val Lys Ser Val Gly Val Met Gly Asp 
450 455 460 

Thr Tyr Asp Gin Val He Ala Leu Arg Ala He Glu Thr Thr 
465 470 475 

Met Thr Ala Asp Trp Tyr Pro Phe Glu His Glu Phe Leu Lys 
485 490 

Ala Ser Arg He Val Asn Glu Val Glu Gly Val Ala Arg Val 
500 505 510 

Asp He Thr Ser Lys Pro Pro Ala Thr Val Glu Trp Glu 
515 520 525 
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CCTCGAACAT CTATCTTCTG AGCTCGATAG TCTACGAAAT CGGCACACTA GCCTAATTGC 60 

CGAGATGAAG AGCTCCAGGG AACCGTTAAA GATCTGATGT TCCATCTTCA ATCAGGACAA 120 

ATGTTACGGG ATGTCCCTGA CGCCACAGAA GGTAGCCTGG TGGTCCAGAC AGAAAAAGAG 180 " 

CCTACACCAA AGAAGAAACA TAACAAGAAA AAGCCTCCGC ATCGTTTTGG TAAATCATAA 240 

TAGGCACGAT GCGCATATAC CCTGACCATC ATAGCGGTTC CCCCCGCTAA CTGCTCCGAG 3 00 

CGGGTAACCC CATGTCACAA AGTGACTCTG TCTCTTCGTG GTAGGTGATG TCAAATTTTC 360 

ACGACTTCCC ACCCC GATGA GCATCCGTAT TCCTTTTCAT C T AAATTCT A ATAGATGGCT 420 

TATGGATTCT TATTGGCGAC TTACAAGCCT ATGTAGTTGG CTTCCCTCAA GTGTTC GTAG 4 80 

TCTACCACCT CACACCCGGT CTAACAGCTT ACGAGAATA ATG GCT ACT AAT GCA 534 

Met Ala Thr Asn Ala 



ATC AAG CTT CTT GCG CCA GAT ATC CAC AGG GGT CTG GCA GAG CTG GTC 
lie Lys Leu Leu Ala Pro Asp lie His Arg Gly Leu Ala Glu Leu Val 
10 15 20 

GCT AAA CGC CTA GGC TTA CGT CTG ACA GAC TGC AAG CTT AAG CGG GAT 
Ala Lys Arg Leu Gly Leu Arg Leu Thr Asp Cys Lys Leu Lys Arg Asp 
25 30 35 

TGT AAC GGG GAG GCG ACA TTT TCG ATC GGA GAA TCT GTT CGA GAC CAG 
Cys Asn Gly Glu Ala Thr Phe Ser lie Gly Glu Ser Val Arg Asp Gin 
40 45 50 

GAT ATC TAC ATC ATC ACG CAG GTG GGG TCC GGG GAC GTG AAC GAC CGA 
Asp He Tyr He He Thr Gin Val Gly Ser Gly Asp val Asn Asp Arg 
55 60 65 

GTG CTG GAG CTG CTC ATC ATG ATC AAC GCT AGC AAG ACG GCG TCT GCG 
Val Leu Glu Leu Leu He Met He Asn Ala Ser Lys Thr Ala Ser Ala 



CGG CGA ATT ACG GCT GTG ATT CCA AAC TTC CCA TAC GCG CGG CAG GAC 
Arg Arg He Thr Ala Val He Pro Asn Phe Pro Tyr Ala Arg Gin Asp 
90 95 100 

CGG AAG GAT AAG TCA CGG GCG CCA ATT ACC GCG AAG CTC ATG GCG GAC 
Arg Lys Asp Lys Ser Arg Ala Pro He Thr Ala Lys Leu Met Ala Asp 
105 110 115 

ATG CTG ACT ACC GCG GGC TGC GAT CAT GTC ATC ACC ATG GAC TTA CAC 
Met Leu Thr Thr Ala Gly Cys Asp His Val He Thr Met Asp Leu His 
120 125 130 
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GCT TCG CAA ATC CAG GGC TTC TTT GAT GTA CCA GTT GAC AAC CTT TAC 966 
Ala Ser Gin lie Gin Gly Phe Phe Asp Val Pro Val Asp Asn Leu Tyr 
135 140 145 

GCA GAG CCT AGC GTG GTG AAG TAT ATC AAG GAG CAT ATT CCC CAC GAC 1014 
Ala Glu Pro Ser Val Val Lys Tyr He Lys Glu His He Pro His Asp 
150 155 160 165 

GAT GCC ATC ATC ATC TCG CCG GAT GCT GGT GGT GCC AAA CGT GCG TCG 1062 
Asp Ala lie He lie Ser Pro Asp Ala Gly Gly Ala Lys Arg Ala Ser 
170 175 180 

CTT CTA TCA GAT CGC CTA AAC TTG AAC TTT GCG CTG ATT CAT AAG GAA 1110 
Leu Leu Ser Asp Arg Leu Asn Leu Asn Phe Ala Leu lie His Lys Glu 
185 190 195 

CGT GCA AAG GCA AAC GAA GTG TCC CGC ATG GTT CTG GTC GGC GAT GTT 1158 
Arg Ala Lys Ala Asn Glu val Ser Arg Met val Leu Val Gly Asp Val 
200 205 210 

ACC GAT AAA GTC TGC ATT ATC GTT GAC GAT ATG GCG GAT ACT TGT GGT 1206 
Thr Asp Lys Val Cys He He Val Asp Asp Met Ala Asp Thr Cys Gly 
215 220 225 

ACG CTG GCC AAG GCG GCA GAA GTG CTG CTA GAG CAC AAC GCG CGG TCT 1254 
Thr Leu Ala Lys Ala Ala Glu Val Leu Leu Glu His Asn Ala Arg Ser 
230 235 240 245 

GTG ATA GCC ATT GTT ACC CAC GGT ATC CTT TCA GGA AAG GCC ATT GAG 1302 
Val He Ala lie Val Thr His Gly He Leu Ser Gly Lys Ala He Glu 
250 255 260 

AAC ATC AAC AAT TCG AAG CTT GAT AGG GTT GTG TGT ACC AAC ACC GTG 1350 
Asn He Asn Asn Ser Lys Leu Asp Arg Val Val Cys Thr Asn Thr Val 
265 270 275 

CCA TTC GAG GAG AAG ATG AAG TTA TGC CCG AAG TTA GAT GTA ATT GAT 139 8 

Pro Phe Giu Glu Lys Met Lys Leu Cys Pro Lys Leu Asp Val He Asp 
280 285 290 

ATC TCG GCA GTT CTT GCG GAA TCC ATT CGC CGT CTA CAC AAT GGT GAA 144 6 

He Ser Ala Val Leu Ala Glu Ser He Arg Arg Leu His Asn Gly Glu 
295 300 305 

AGT ATC TCC TAC CTC TTT AAA AAC AAC CCA CTA TGATTTTGCT TCTCGATGCT 1499 
Ser He Ser Tyr Leu Phe Lys Asn Asn Pro Leu 
310 315 320 

GGCTTCTTGA GGGCCAATTT TGCCGTAGAG GTAGTATCCC TTCTTTTTAT ATTGACTATT 1559 

TAACGAAGAC TATTTCTTCA TAAATGG AC T TCGGCTTCAC TGTGAATCTC ACATGATATA 1619 

GTTGTTTCAG AGACC 1634 
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(2) INFORMATION ZU SEQ ID NO: 13: 

(i) SEQUENZ CHABAKTERISTIKA: 

(A) LANGE: 320 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 13: 

Met Ala Thr Asn Ala lie Lys Leu Leu Ala Pro Asp lie His Arg Gly 
15 10 15 

Leu Ala Glu Leu Val Ala Lys Arg Leu Gly Leu Arg Leu Thr Asp Cys 
20 25 30 

Lys Leu Lys Arg Asp Cys Asn Gly Glu Ala Thr Phe Ser lie Gly Glu 
35 40 45 

Ser Val Arg Asp Gin Asp lie Tyr lie lie Thr Gin Val Gly Ser Gly 
50 55 60 

Asp Val Asn Asp Arg Val Leu Glu Leu Leu He Met He Asn Ala Ser 
65 70 75 80 

Lys Thr Ala Ser Ala Arg Arg He Thr Ala Val He Pro Asn Phe Pro 
85 90 95 

Tyr Ala Arg Gin Asp Arg Lys Asp Lys Ser Arg Ala Pro lie Thr Ala 
100 105 110 

Lys Leu Met Ala Asp Met Leu Thr Thr Ala Gly Cys Asp His Val He 
115 120 125 

Thr Met Asp Leu His Ala Ser Gin He Gin Gly Phe Phe Asp Val Pro 
130 135 140 

Val Asp Asn Leu Tyr Ala Glu Pro Ser Val Val Lys Tyr He Lys Glu 
145 150 155 160 

His He Pro His Asp Asp Ala He He He Ser Pro Asp Ala Gly Gly 
165 170 175 

Ala Lys Arg Ala Ser Leu Leu Ser Asp Arg Leu Asn Leu Asn Phe Ala 
180 185 190 

Leu He His Lys Glu Arg Ala Lys Ala Asn Glu Val Ser Arg Met Val 
195 200 205 

Leu Val Gly Asp Val Thr Asp Lys Val Cys He He Val Asp Asp Met 
210 215 220 
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Ala Asp Thr Cys Gly Thr Leu Ala Lys Ala Ala Glu Val Leu Leu Glu 
225 230 235 240 

His Asn Ala Arg Ser Val He Ala He Val Thr His Gly He Leu Ser 
245 250 255 

Gly Lys Ala He Glu Asn He Asn Asn Ser Lys Leu Asp Arg Val Val 
260 265 270 

Cys Thr Asn Thr Val Pro Phe Glu Glu Lys Met Lys Leu Cys Pro Lys 
275 280 285 

Leu Asp Val He Asp He Ser Ala Val Leu Ala Glu Ser He Arg Arg 
290 295 300 

Leu His Asn Gly Glu Ser He Ser Tyr Leu Phe Lys Asn Asn Pro Leu 



Patentanspruche 

1 . Protein mit der in SEQ ID N0:2 dargestellten Polypeptidsequenz oder einer aus SEQ ID NO:2 durch Substitution, 
Insertion Oder Deletion von bis zu 15% der Aminosauren erhalUichen Polypeptidsequenz und der enzymatischen 

30 Aktivitat einer Phosphoribosylpyrophosphat-Synthetase. 

2. Protein nach Anspruch 1 , das keine feed-back Hemmung durch Folgeprodukte von Stoffwechselwegen, die von 
Produkten des Enzyms ausgehen, mehr aufweist. 

35 3. Protein nach Anspruch 1, das nicht mehr durch Zwischenprodukte der Purinbiosynthese, insbesondere durch 
Purinbasen, Purinnukleoside, PurinnuWeotid-5'-Monophosphate oder PurinnuWeotid-5'-Diphosphate oder Purin- 
nuWeotid-5'-Triphosphate gehernrnt werden. 

4. Protein nach Anspruch 1, bei dem eine oder mehrere der folgenden Aminosaureaustausche vorliegen: Lysin an 
40 Position 7 ausgetauscht gegen Valin, Aspartat an Position 52 ausgetauscht gegen Histidin, Leucin an Position 133 

ausgetauscht gegen Isoleucin, Aspartat an Position 186 ausgetauscht gegen Histidin, Alanin an Position 193 aus- 
getauscht gegen Valin oder Histidin an Position 196 ausgetauscht gegen Glutamin. 

5. NuWeinsauresequenz codierend fur ein Protein gemaB Anspruch 1 . 

45 

6. Protein mit der in SEQ ID NO: 13 dargestellten Polypeptidsequenz oder einer aus SEQ ID NO: 13 durch Substitu- 
tion, Insertion oder Deletion von bis zu 10% der Aminosauren erhaltiichen Polypeptidsequenz und der enzymati- 
schen Aktivitat einer Phosphoribosylpyrophosphat-Synthetase. 

so 7. NuWeinsauresequenz codierend fur ein Protein gemaB Anspruch 6. 

8. Protein mit der in SEQ ID NO:5 dargestellten Polypeptidsequenz oder einer aus SEQ ID NO:5 durch Substitution, 
Insertion oder Deletion von bis zu 10% der Aminosauren erhaltiichen Polypeptidsequenz und der enzymatischen 
Aktivitat einer Glutamin-Phosphoribosylpyrophosphat-Amidotransferase. 

55 

9. Protein nach Anspruch 8, das keine feed-back Hemmung durch Folgeprodukte von Stoffwechselwegen, die von 
Produkten des Enzyms ausgehen, mehr aufweist. 
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10. Protein nach Anspruch 8, das nicht mehr durch Zwischenprodukte der Purinbiosyrrthese, insbesondere durch 
Purinbasen, PurinnuWeoside, PurinnuWeotid-S-Monophosphate oder PurinnuWeotjd-5'-Diphosphate oder Purin- 
nuWeotid-5'-Triphosphate gehemmt werden. 

s 11. Protein nach Anspruch 8, bei dem eine oder mehrere der folgenden Aminosaureaustausche vorliegen: Aspartat an 
Position 310 ausgetauscht gegen Valin, Lysin an Position 333 ausgetauscht gegen Alanin oder Alanin an Position 
41 7 ausgetauscht gegen Tryptophan. 

12. Nukleinsauresequenz codierend fur ein Protein gemaB Anspruch 8. 

10 

13. Protein mit der in SEQ ID NO:8 und 9 dargestellten Polypeptidsequenz oder einer aus SEQ ID NO:8 und 9 durch 
Substitution, Insertion oder Deletion von bis zu 20% der Aminosauren erhaitlichen Polypeptidsequenz und der 
enzymatischen Aktivitat einer IMP-Dehydrogenase. 

15 14. Protein nach Anspruch 13, das keine feed-back Hemmung durch Folgeprodukte von Stoffwechselwegen, die von 
Produkten des Enzyms ausgehen, mehr aufweist. 

15. Protein nach Anspruch 13, das nicht mehr durch Zwischenprodukte der Purinbiosynthese, insbesondere durch 
Purinbasen, PurinnuWeoside, PurinnuWeotid-5'-Monophosphate oder PurinnuWeotid-5'-Diphosphate oder Purin- 

20 nuWeotid-5'-Triphosphate gehemmt werden. 

16. Nukleinsauresequenz codierend fur ein Protein gemaB Anspruch 13. 

17. Protein mit der in SEQ ID NO:11 dargestellten Polypeptidsequenz oder einer aus SEQ ID NO:11 durch Substitu- 
25 tion, Insertion oder Deletion von bis zu 10% der Aminosauren erhaitlichen Polypeptidsequenz und der enzymati- 
schen Aktivitat einer GMP-Synthetase. 

18. Protein nach Anspruch 17, das keine feed-back Hemmung durch Folgeprodukte von Stoffwechselwegen, die von 
Produkten der Enzyme ausgehen, mehr aufweist. 

30 

19. Protein nach Anspruch 17, das nicht mehr durch Zwischenprodukte der Purinbiosynthese, insbesondere durch 
Purinbasen, PurinnuWeoside, PurinnuWeotid-5'-Monophosphate oder PurinnuWeotid-5'-Diphosphate oder Purin- 
nuWeotid-5'-Triphosphate gehemmt werden. 

35 20. NuWeinsauresequenz codierend fur ein Protein gemaB Anspruch 1 7. 

21 . Verwendung einer oder mehrerer der NuWeinsauresequenzen nach den oben genannten Anspruchen zur gentech- 
nischen Konstruktion von Mikroorganismen, die zur Herstellung von Riboflavin in der Lage sind. 

40 22. Verfahren zur Herstellung von Riboflavin durch Kultivierung von Mikroorganismen, die in mindestens einem Gen 
der Purinbiosynthese genetisch verandert worden sind. 

23. Verfahren nach Anspruch 22, dadurch gekennzeichnet, daB es sich bei dem Mikroorganismus urn ein BaWerium 
der Gattung Bacillus oder Corynebakterium handelt. 

45 

24. verfahren nach Anspruch 22, dadurch gekennzeichnet, daB es sich bei dem Mikroorganismus urn einen eukaryon- 
tischen Mikroorganismus handelt. 

25. Verfahren nach Anspruch 24, dadurch gekennzeichnet, daS es sich bei dem Mikroorganismus urn Ashbya gossypii 
so handelt. 

26. Verfahren nach Anspruch 24. dadurch gekennzeichnet, daB es sich bei dem Mikroorganismus urn eine Hefe han- 
delt. 

55 27. Verfahren nach Anspruch 22, dadurch gekennzeichnet, daB es sich bei dem Mikroorganismus urn eine Hefe der 
Gattung Candida. Saccharomyces oder Pichia handelt. 

28. Verfahren nach Anspruch 22, dadurch gekennzeichnet, daB die Veranderung in mindestens einer zusatzlichen 
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Kopie von mindestens einer der Nukleinsauresequenzen gemaB Anspruch 5. 12, 16, 20 besteht 

29. Verfahren nach Anspruch 22, dadurch gekennzeichnet, daB durch die genetische Veranderung ein Gen codierend 
fur ein Protein gemaB Anspruch 1, 6, 13, 17 erzeugt wird. 
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